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(57) Abstract 

Up until now, a central and global unit 
have been integrated into one module which 
processes all of the configuration requests. The 
invention provides for. a plurality of active units 
which can take over^his task. These units 
are arranged in a hjerarchy. A request from 
the lowest level is. only transferred to the next 
highest level if tin request cannot be processed. 
The highest level is connected to an internal 
or external higher-order configuration memory 
which contains all the configuration data ever 
required for this programme run. The tree 
structure of the configuration units enables a 
kind of cacheing of the configuration data. The 
configurations are mainly accessed locally. In 
the worst case scenario, a configuration has to 
be loaded from the higher-order configuration 
memory in case the relative data are not available in any of the CTs (configuration tables) in the hierarchy. 
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(57) Zusammenfassung 

Anstatt wie bisher eine zentrale und globale Einheit in einen Baustein 2U integrieren, welche alle Konfigurations-Anforderungen 
bearbeitet, existieren nun eine Mehrzahl von hierarchisch angeordneten aktiven Einheiten, welche diese Aufgabe ubemehmen kdnnen. 
Dabei wird eine Anforderung von der tiefsten Ebene nur dann an die nachst hoher gelegene Ebene weitergeleitet, wenn die 
Anforderung nicht bearbeitet werden konnte. Die hochst gelegene Ebene ist an einen intemen Oder extemen tibergeordneten 
Konfigurationsspeicher angeschlossen, der alle jemals fur diesen Programmlauf benotigten Konfigurationsdaten enth&lt. Durch die 
Baumstruktur der Konfigurationseinheiten wird eine Art Cacheing der Konfigurationsdaten erreicht Zugriffe auf Konfigurationen finden 
hauptsachlich lokal start Im ungtinstigsten Fall muss eine Konfiguration aus dem tibergeordneten Konfigurationsspeicher geladen werden, 
falls die betreffenden Daten in keiner der hierarchisch angeordneten CTs vorhanden sind. 
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Verfahren zum hierarchischen Cachen von 
Konfigurationsdaten von Datenf luftprozessoren und 
Bausteinen mit zwei- oder mehrdimensionaler 
programmierbarer Zellstruktur (FPGAs , DPGAs, o. dgl . ) 

Hintergrund der Erfindung 
Stand der Technik 

Der Stand der Technik, welcher diese Patentschrift 
zugrunde liegt, ist durch die Patentanmeldung 196 54 
846.2-53 (Verfahren zum selbstandigen dynamischen 
Umladen von Datenf lufiprozessoren (DFPs) sowie Bausteinen 
mit zwei- oder mehrdimensionaler programmierbaren 
Zellmatrix (FPGAs, DPGAs, o.dgl.) und der 
Patentanmeldung 196 54 593.5-53 (Umkonf igurierungs 
Verfahren fur programmierbare Bausteine zur Laufzeit) 
beschrieben. Darin wird ein Verfahren zur Konf iguration 
und Umkonf iguration von DFPs, sowie FPGAs, DPGAs und 
ahnlichen Bausteinen nach dem Stand der Technik, 
beschrieben, bei dem ein separat ausgestalteter zentral 
ubergeordneter Mikrokontroller-ahnlicher Baustein die 
Verteilung von Konfigurationsdaten an mehrere 
untergeordnete, weitgehend passive Steuereinheiten 
ubernimmt . 

Probleme 

Durch den Einsatz einer zentralen und globalen Einheit, 
welche die Rekonf iguration von Teilen (z.B. Zellen 
(CELs)) eines oder mehrerer Bausteine steuert, kommt es 
zu Engpassen, wenn viele verschiedene Rekonf igurations- 
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Anfragen auf einmal behandelt werden miissen. Die 
Vorteile der Parallelitat , der beschriebenen Bausteine, 
wird durch eine solche zentrale Einheit stark 
eingeschrankt, da sie den typischen "Flaschenhals" 
darstellt und die Verarbeitung der Daten dadurch 
erheblich verlangsamt. 

Weiterhin ist die Zuordnung der Ereignisquelle zu der zu 
ladenden Konf iguration problematisch, da rait absoluten 
Adressen des Konf igurationsspeichers gearbeitet wird. 
Die Rekonfigurations-Einheit muft also eine Art 
Speicherverwaltungssystem beinhalten, welche, ahnlich 
wie in einem Betriebssystem, mitprotokolliert, welche 
Speicherbereich von welcher Konf iguration benutzt 
werden . 

Ein zusatzliches Problem stellt die Verwaltung der 
Resourcen (z.B. CELs) dar. Es muft sichergestellt sein, 
daft jede CEL nur genau einmal an einen von einer 
Rekonf igurationsanf rage gestartetem Algorithmus vergeben 
wird und zwar denjenigen der auch die restlichen 
umliegenden CEL verwendet, da ansonsten Deadlocks 
auftreten konnen. 

Um die Problematik der Umkonf iguration nochmals zu 
verdeutlichen wird folgendes Beispiel gegeben: 
Eine Matrix aus CELs ist unkonf iguriert und im RESET- 
Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie 
sich in einem umkonf igurierbaren Zustand befindet. Alle 
CELs in der Matrix sind bereit konfiguriert zu werden; 
befinden sich also in einem umkonf igurierbaren Zustand. 
Eine erste Konf igurationsroutine (KR1) wird geladen, 
wobei die Matrix nicht vollstandig benutzt wird. Die 
konfigurierten CELs heben die Anzeige, daft sie sich in 
einem konf igurierbaren Zustand befinden auf. In eine 
Gruppe der noch nicht konfigurierten CELs wird eine 
zweite, von der Ersten unabhangigen, 
Konf igurationsroutine (KR2) geladen. Eine dritte 
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Konfiguration kann nicht geladen werden, da diese CELs 
der ersten und/oder zweiten Konf igurationsroutine (KR3) 
benotigt, die sich aber in keinem umkonf igurierbaren 
Zustand befinden, da sie benutzt werden. 
KR3 mufi so lange angehalten werden, bis die benotigten 
CEL freigegeben wurden, d.h. KR1 und KR2 terminiert 
haben . 

Wahrend der Ausfiihrung von KR1 und KR2 kommt eine 
Ladeanforderung fur eine vierte Konf igurationsroutine 
(KR4) und eine funfte Konf igurationsroutine (KR5) hinzu, 
die alle nicht sofort geladen werden konnen, da sie CELs 
benutzen, die von KR1 und KR2 verwendet werden. KR3 und 
KR4 benutzen teilweise die selben CELs, KR5 benutzt 
keine der CELs von KR3 und KR4 . 

Urn KR3-5 ordentlich nachzuladen existieren folgende 
Forderungen: 

1. KR3-5 sollen so geladen werden, daii die zeitliche 
Reihenfolge gemaft den Ladeanforderungen moglichst 
beibehalten wird. 

2. Moglichst viele KR die unabhangig von einander sind, 
also keine gemeinsamen CELs besitzen, sollen geladen 
werden, um ein Hochstmafi an Parallelitat zu erhalten. 

3. Die KRs diirfen sich nicht gegenseitig blockieren, 
d.h. KR3 ist teilweise geladen, kann jedoch nicht weiter 
geladen werden, da andere CELs durch die teilweise 
geladene KR4 blockiert sind; wahrend KR4 auch nicht 
weiter geladen werden kann, da wiederum benotigte CELs 
durch KR3 blockiert sind. Dies fiihrt zu einer typische 
Deadlock-Situation . 

4. Dem Compiler, der die KRs generiert hat ist es nicht 
moglich das zeitliche Zusammenspiel der KRs zu erkennen 
und so auf zulosen, daii es zu keiner Konf liktsituation 
kommt . 



3 



WO 99/44147 



PCT/DE99/00504 



Dabei soli das Verhaltnis zwischen den Aufwand fur eine 
zu realisierende Schaltung und eines optimalen 
Ergebnisses moglichst gut sein, d.h. Ziel der Erfindung 
ist es mit moglichst geringem Aufwand eine flexible, 
parallele, Deadlock-f reie Konf iguration zu ermoglichen, 
die mit wenig Zeit- und Rechenaufwand durchgefuhrt 
werden kann. Dabei miissen folgende Grundprobleme gelost 
werden : 

- Wiirde nur KR3 geladen werden, ware das Verfahren 
Deadlock-f rei, doch nicht optimal, da auch KR5 geladen 
werden konnte. 

- Wird KR3 geladen, KR4 nicht, jedoch KR5 mufl KR4 so 
vorgemerkt werden, daii es bei einem nachf olgenden 
Ladevorgang die hochste Prioritat besitzt, was einen 
hohen Verwaltungsaufwand bedeutet. 

Die Deadlockfreiheit ist durch das nachfolgend 
beschriebene Verfahren gegeben: 

Verbesserung durch die Erfindung, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine 
Einheit - im folgenden Konf igurationstabelle (CT) 
genannt die hierarchisch aufgebaut ist und auf jeder 
Ebene mehrfach vorkommen kann, wobei sich die Zahl der 
CTs von der untersten Hierarchiestuf e zur obersten so 
verringert, dafi auf der hochsten Ebene genau eine CT 
vorhanden ist. Jede CT konfiguriert und kontrolliert 
unabhangig von anderen und parallel eine Mehrzahl von 
konf igurierbaren Elementen (CELs) . CTs hoherer 
Hierarchiestufen konnen Konf igurationsroutinen fur 
tieferliegende CTs zwischenspeichern . Benotigen mehrere 
der tieferliegenden CTs ein und dieselbe 
Konfigurationsroutine, wird diese bei einer 
hoherliegenden CT zwischengespeichert und von den 
einzelnen CTs abgerufen, wobei die hoherliegende CT die 
betreffende Konfigurationsroutine nur ein Mai aus einem 
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globalen gemeinsamen Konf igurationsspeicher abruft, 
wodurch ein Cache-Effekt erzielt wird. Abseits 
konfigurierbarer Bausteine kann die vorliegende 
Erfindung als Cacheverf ahren fur Instruktions- und 
Datencache in Mikroprozessoren, DFP oder dgl . mit 
mehreren Rechenwerken eingesetzt werden. Dabei konnen, 
je nach Anwendung, einige der im folgenden beschriebenen 
Einheiten entfallen (z.B. FILMO) , am hierarchischen 
Aufbau andert sich jedoch grundlegend nichts. Deshalb 
wird dieser Einsatz als eine Teilmenge betrachtet und 
nicht weiter darauf eingegangen. Ein erheblicher Vorteil 
des beschriebenen Verfahrens gegenuber gewohnlichen 
Cacheverfahren ist, daft Daten und/oder Code selektiv, 
d.h. anhand von exakt auf den Algorithmus abgestimmten 
Methoden gecached werden. 

Ebenfalls ermoglicht die vorliegende Erfindung das 
vollstandig deadlockf reie Umkonf igurieren von groften 
Zellstrukturen. 

Beschreibung der Erfindung 

Anstatt wie bisher eine zentrale und globale Einheit in 
einen Baustein zu integrieren, welche alle 
Konfigurations-Anforderungen bearbeitet, existieren nun 
eine Mehrzahl von hierarchisch (Baumstruktur) 
angeordneten aktiven Einheiten, welche diese Aufgabe 
ubernehmen konnen. 

Dabei wird eine Anforderung von der tiefesten Ebene (den 
Blattern in der Hierarchie) nur dann an die nachst hoher 
gelegene Ebene weitergeleitet, wenn die Anforderung 
nicht bearbeitet werden konnte. Diese Schritte werden 
fur alle vorhandenen Ebenen wiederholt, bis die hochst 
gelegene Ebene erreicht ist. 

Die hochst gelegene Ebene ist an einen internen oder 
externen iibergeordneten Konf igurationspeicher 
angeschlossen, der alle jemals fur diesen Programlauf, 
benotigten Konf igurationsdaten enthalt . 
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Durch die Baumstruktur der Konf igurationseinheiten wird 
eine Art Cacheing der Konf igurationsdaten erreicht. 
Zugriffe auf Konf igurationen finden hauptsachlich lokal 
statt. Im ungunstigsten Fall muss eine Konf iguration aus 
den iibergeordneten Konf igurationsspeicher geladen 
werden, falls die betreffenden Daten in keiner der 
hierarchisch angeordneten CTs vorhanden sind. 
Deadlocks werden verhindert, indem eine feste zeitliche 
Abfolge der zu ladenden Konf igurationen eingefuhrt wird 
und die Konf igurationen zu einer Liste zusammengef afit 
werden. Die Statusinf ormationen der CEL werden vor dem 
Laden gesichert und bleiben dadurch wahrend des 
Abarbeitens der gesamten Liste von Konf igurationen 
unverandert . 

Die Grundlagen der CT 

Eine Konf igurationstabelle (CT) ist eine aktive Einheit, 
die auf Synchronisationssignale, sogenannten Trigger, 
reagiert. Die Trigger werden von einer zwei- oder 
mehrdimensionalen Matrix aus elektronischen Baugruppen, 
fur gewohnlich arithmentischen oder logischen Einheiten, 
Adressgeneratoren, Recheneinheiten, o.a. - im folgenden 
konfigurierbare Elemente (CEL) genannt - generiert. 
Anhand des auftretenden Trigger wird eine bestimmte 
Aktion innerhalb der CT ausgelost. Dabei ist es Aufgabe 
der CT die Steuerung einer Mehrzahl von CELs zu 
ubernehmen und deren arithmetischen und/oder logischen 
Operationen zu bestimmen. Insbesondere miissen CELs 
konfiguriert und umkonf iguriert werden. Diese Aufgabe 
ubernimmt eine CT, indem sie eine Mehrzahl von moglichen 
Konf igurationsroutinen (KR) , die ihrerseits jeweils aus 
einer Mehrzahl von einzelnen Konf igurationsworten (KW) 
bestehen, verwaltet und eine Mehrzahl von CELs aufgrund 
von Triggerbedingungen mit einer oder mehrerer der KR 
konfigurieren. Dabei erhalt eine CEL jeweils eines oder 
mehrere der Konf igurationsworte, die mit der Adresse der 
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zu konfigurierenden CEL versehen sind. Eine KR mufi dabei 
vollstandig und korrekt auf eine Mehrzahl von CELs 
abgebildet werden, wobei mehrere CELs zu Gruppen 
zusammengefafit sein konnen; die mit jeweiis 
unterschiedlichen, aber vollstandig ausgefuhrten KRs 
konfiguriert werden. Dabei sind alle CELs in einer 
Gruppe so verschaltet, daft nach Feststellung einer 
notwendigen Umkonf igurierung alle gruppierten CELs durch 
ein gemeinsames Signal (ReConfig) mitgeteilt wird, daft 
jede CEL die Datenverarbeitung zu beenden und in einen 
umkonf igurierbaren Zustand uberzugehen hat. 

Grundlagen der deadlockfreien Umkonf iguration 

Bei zur Laufzeit umkonf igurierbaren Systemen tritt das 
Problem auf, dali das System in einen Zustand gelangen 
kann, in dem jeweiis zwei Teile aufeinander warten und 
somit eine Deadlock Situation eingetreten ist. 

Dieses Problem konnte vermieden werden, indem eine neue 
Konf iguration immer nur ganz oder gar nicht in das 
System geladen wird, oder eine Art Timeout-Verf ahren 
eingesetzt wird. 

Dadurch entstehen ein Reihe von Nachteilen (benotigter 
Platz, Laufzeit etc.) und Problemen, wie zum Beispiel: 

- Vorgehen, falls eine Konf iguration nicht geladen 
werden kann. 

- Verwaltung der Reihenfolge, in der die Konf igurationen 
geladen werden 

- Performance Einbruch, da andere Konf igurationen, 
welche eventuell in die CELs geladen werden konnten, 
nicht beachtet werden. 

Mit dem folgend beschriebenen Verfahren konnen diese 
Probleme beseitigt werden. Es wird von einem DFP System 
nach dem Stand der Technik ausgegangen. 
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Von einer CEL aus, wird ein Trigger-Signal an eine CT 
gesendet. Diese CT stellt die Triggerquelle fest und 
wahlt durch eine Look-Up Tabelle eine zu ladende 
Konf iguration (KR) aus. Die eingehenden Triggersignale 
werden gesperrt, es werden keine weiteren Trigger bis 
zur kompletten Abarbeitung der aktuellen Konf iguration 
akzeptiert. Eine Konf iguration besteht aus mehreren 
Befehlen, welche an eine Menge von CELs ubertragen wird. 
In einem zur Laufzeit konf igurierbaren System ist 
allerdings nicht sichergestellt, daft jeder 
Konfigurations-Befehl (KW) auch ausgefuhrt werden kann. 
Dies kann zum Beispiel daran scheitern, daft das 
adressierte konf igurierbare Element (CEL) seine Aufgabe 
noch nicht beendet hat und somit keine neuen 
Konfigurationsdaten entgegen nehmen kann. Urn einen 
Performance Einbruch zu verhindern, werden alle 
Konfigurationsbefehle, welche nicht abgearbeitet werden 
konnten (da sich die entsprechenden CELs in einem nicht 
umkonfigurierbaren Zustand befanden und die 
Konf iguration ablehnten (REJECT) ) , entsprechend eines 
FIFOs hinter den letzten sich in einem (nachfolgend 
naher beschrieben) speziellen Speicher (FILMO) 
befindenden Konf igurationsbefehl geschrieben. Danach 
wird der nachsten Konf igurationsbefehl, nach dem 
gleichen Verfahren, abgearbeitet. Dies wiederholt sich 
solange, bis das Ende einer Konf iguration erreicht 
wurde . 

Danach geht die CT, wieder in den Zustand uber, in dem 
sie Trigger-Signale akzeptiert, urn eventuell weiter 
Konfigurationen zu laden. In diesem Zustand arbeitet die 
CT den FILMO in regelmaftigen Abstanden, durch einen 
Zeitgeber gesteuert, ab. 
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Eine Priorisierung der zu ladenden Konf igurationen wird 
erreicht, indem die CT den Speicher FILMO durchlauf t, 
bevor die eigentlich zu ladende Konf iguration bearbeitet 
wird. Durch eine FIFO-ahnliche Struktur des FILMO wird 
sichergestellt, daft KWs, welche wahrend vorhergehenden 
Triggeranforderungen nicht vollstandig abgearbeitet 
werden konnten, automatisch eine hohere Prioritat vor 
den neu abzuarbeitenden WK erhalten. Bei der Abarbeitung 
des Speichers (FILMO) wird jedes durch einen 
Konfigurationsbefehl adressierte konf igurierbare Element 
(CEL) vor oder wahrende des Sendens eines KWs getestet, 
ob es sich im Zustand "umkonf igurierbar" befindet. 1st 
dieser Zustand "umkonf igurierbar" (ACCEPT) , werden die 
Daten ubertragen und aus dem Speicher FILMO geldscht. 
1st der Zustand "nicht umkonf igurierbar" (REJECT), 
bleiben die Daten im FILMO und werden beim nachsten 
Durchlauf erneut abgerarbeitet . Die CT verarbeitet den 
nachsten Eintrag im FILMO. 

Dies wiederholt sich solange, bis das Ende des FILMO 
erreicht ist. Danach wird die eigentliche, durch das 
Auftreten des Trigger-Signals aktivierte Konf iguration 
abgearbeitet. Der Aufbau des FILMOs entspricht dabei dem 
FIFO Prinzip, das heiAt, es werden die altesten Eintrage 
zuerst verarbeitet. Urn den FILMO auch abzuarbeiten, wenn 
keine neue KR geladen wird, wird der FILMO von einem 
Timer gesteuert in regelmaMgen Abstanden durchlauf en. 

Die tibrigen, nicht beteiligten konf igurierbaren Elemente 
(CEL) arbeitet wahrend dieser Phase parallel weiter und 
wird nicht in ihrer Funktion beeinfluftt. Dadurch kann 
der Fall eintreten, dafi wahrend die CT den FILMO 
abarbeitet, eine oder mehrere konf igurierbaren Elemente 
(CELs) in den Zustand "umkonf igurierbar" ubergehen. Da 
die CT sich mit der Abarbeitung an einer beliebigen 
Stelle innerhalb des FILMOs befinden kann, konnte 
folgender Fall eintreten: 
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Die CT versucht einen ersten Befehl abzuarbeiten dessen 
adressiertes konf igurierende Element (CEL) sich nicht in 
dem Zustand "umkonf igurierbar" befindet. Die CT fahrt 
somit mit dem nachsten Befehl (KW) fort. Zur selben Zeit 
gehen ein oder mehrere konf igurierbaren Elemente in den 
Zustand "umkonf igurierbar " iiber, darunter auch das 
konf igurierbare Element, welches durch den ersten 
Konf igurationsbefehl hatte beschrieben werden konnen. 
Die CT verarbeitet einen zweiten Konf igurationsbefehl 
{KW) , welcher das gleiche konf igurierbare Element (CEL) 
benutzt, wie der erste Konf igurationsbefehl, allerdings 
aus einer anderen Konf iguration stammt. Zu diesem 
Zeitpunkt, befindet sich das konf igurierbare Element 
(CEL) in dem Zustand "umkonf igurierbar" und der Befehl 
kann erfolgreich abgerarbeitet werden. 

Dadurch ist nicht mehr sichergestellt , daft die 
Konfiguration, welche zuerst geladen werden sollte, auch 
tatsachlich zuerst f ertiggestellt wird. Es konnen nun 
zwei teilweise fertige Konf igurationen existieren, 
welche jeweils konf igurierbare Elemente der anderen 
Konfiguration benotigen, um vollstandig geladen zu 
werden. Eine Deadlock-Situation ist eingetreten, die in 
Figur 18 verdeutlicht wird. Konfiguration A und 
Konfiguration B sollen konfiguriert werden. Die CT hat 
den schraf fierten Teil von Konfiguration A und 
Konfiguration B bereits geladen. Konfiguration A 
benotigt zur Fertigstellung noch den hell-doppelt 
schraf fierten Bereich von Konfiguration B, und 
Konfiguration B benotigt zur Fertigstellung noch den 
dunkel-doppelt schraf fierten Bereich von Konfiguration 
A. Da beide Konf igurationen noch nicht vollstandig 
abgeschlossen sind, und somit auch nicht f unktionsf ahig, 
tritt fur keine der beiden Konf igurationen der 
Terminierungszustand ein, in dem eine der 
beiden Konf igurationen entfernt wiirde. Beide 
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Konf igurationen warten darauf, daft die noch benotigten 
konfigurierbaren Elemente freigegeben werden. 

In dem vorliegenden Verfahren wird ein Deadlock 
verhindert, indent die CT vor der Abarbeitung des FILMOs 
die Zustande aller konf igurierbarer Elemente erfaftt und 
danach bis zur Beendigung des Vorgangs keine Anderungen 
mehr zulaftt, bzw. auftretende Anderungen ignoriert. Mit 
anderen Worten, es werden entweder die Zustande aller 
konfigurierbaren Elemente vor der Abarbeitung des FILMOs 
gesichert oder eine Veranderung der Zustande wahrend der 
Abarbeitung des FILMOs verhindert. Eine mogliche 
technische Ausfiihrung ist der Einsatz eines Registers in 
jedem konfigurierbaren Element, in das der Zustand vor 
Abarbeitung des FILMOs gesichert wird. Die CT arbeitet 
nur auf Basis der erfaftten Zustanden und nicht mit den 
aktuellen Zustanden der konfigurierbaren Elemente. 
Dadurch ist sichergestellt , daft jeder zu bearbeitende 
Befehl (KW) den gleichen Zustand der konfigurierbaren 
Elemente (CELs) vorfindet. Dieser Schritt schlieftt nicht 
aus, daft ein oder mehrere konfigurierbaren. Elemente 
wahrend der Abarbeitung des FILMOs, in den Zustand 
"umkonfigurierbar" ubergehen. Diese Anderung ist fur die 
CT wahrend der Verarbeitung lediglich nicht sofort 
sichtbar, sondern erst zu Beginn des nachsten 
Durchlaufs. 

Konfigurations-Reihenfolgen 

Zur Konfiguration bestimmter Algorithmen ist es 
unbedingt notwendig, die Reihenfolge in der die KW in 
die CEL geschrieben werden exakt einzuhalten. 
Beispielsweise ist es sinnvoll vor Anschluft einer CEL an 
ein Bussystem, zuerst das Bussystem zu konf igurieren, 
damit die CEL nicht an einen von einer anderen Routine 
benutzten Bus angeschlossen wird. Mit anderen Worten, 
eine CEL wird nur konf iguriert , wenn vorher die 



11 



WO 99/44147 



PCT/DE99/00504 



entsprechenden Busverbindungen konfiguriert werden 
konnten. 

In dem erf indungsgemaAen Verfahren wird die Einhaltung 
eines festen Ablaufes wie folgt erreicht: 
Konfigurationsworte (KWs), deren Ausfiihrung entscheidend 
fur die Konf iguration der nachf olgenden KWs sind, werden 
besonders gekennzeichnet (und im f olgenden KWR genannt) . 
Schlagt die Konf iguration eines solchen KWR fehl, werden 
alle nachfolgenden KWs innerhalb der betreffenden 
Konfigurationsroutine (KR) auf den FILMO geschrieben und 
in diesem Durchlauf nicht ausgefiihrt. Auch beim 
Durchlaufen des FILMOs werden samtliche KWs, die sich in 
der Reihenfolge hinter einem KWR befinden, dessen 
Konfiguration fehlschlug, in dem aktuellen Durchlauf 
nicht ausgefiihrt. 

Cache-Verfahren 

Die CT-Struktur ist hierarchisch aufgebaut, d.h. es 
existieren in einem Baustein mehrere CT-Ebenen. Die 
Anordnung entspricht vorzugsweise einer Baumstruktur 
(CT-Tree) . Dabei ist der Wurzel-CT (Root-CT) ein 
externer Konf igurationsspeicher (ECR) , der samtliche KRs 
enthalt zugeordnet, wahrend den Blattern die 
konfigurierbaren Elemente (CELs) zugeordnet sind, die 
einzelne KRs aufrufen. Den CTs der mittleren Ebenen sind 
jeweils die konfigurierbaren Elemente zugeordnet, die 
sich auf derselben Hierarchiestuf e befinden. 
Jeder CT ist ein lokaler interner Speicher zugeordnet. 
Dieser Speicher wird partiell geloscht, wenn neu zu 
speichernde KRs keinen Platz mehr haben, Oder dies 
explizit durch einen speziellen CT-Befehl (REMOVE) 
angefordert wird. Dabei er folgt das Loschen KR-weise, 
anhand einer Loschstrategie, so dafi bestenfalls nur die 
KR geloscht werden, die nicht mehr angefordert werden 
Oder explizit beim REMOVE-Be fehl angegeben sind. 
Ebenfalls werden die KR einzeln geloscht, nur genau so 
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viele, daft genau so viel Speicher frei ist, wie 
notwendig ist urn die neu zu ladende KR in den Speicher 
zu schreiben. Dadurch wird erreicht, daft moglichst viele 
KR zur Optimierung des Cache-Ef f ektes in dem Speicher 
verbleiben. 

Der Vorteil liegt darin, daft jede, einer beliebigen CTx 
untergordente CT, die sich also weiter oberhalb im CT- 
Baum befindet eine KR, die in der CTx gespeichert ist, 
nicht von dem externen Konf igurationsspeicher ECR 
anfordert, sondern direkt von CTx erhalt. Dadurch ergibt 
sich eine Cachestruktur uber mehrere Ebenen. Der 
Datemibertragungsaufwand ira CT-Baum und insbesondere die 
benotigte Speicherbandbreite des ECR wird erheblich 
gesenkt . 

Mit anderen Worten speichert jede CT die KRs der unter 
ihr liegenden CT zwischen. D.h. die tief erliegenden CTs 
erhalten die benotigten KRs direkt von den 
daruberliegenden, ein Speicherzugrif f auf das externe 
ECR ist nicht notwendig. Nur wenn eine benotigte KR 
nicht in einer der hoherliegenden CTs bereits vorhanden 
ist, muft die KR liber einen Zugriff auf das ECR geladen 
werden. Dadurch ergibt sich einer besonders effiziente 
hierarchische Cache-Struktur fur KRs. 
Auf Basis dieser Struktur ergeben sich auch mogliche 
Loschstrategien, die allerdings je nach Anwendung 
empirisch festgelegt werden sollten. Einige 
Moglichkeiten sind: 

- Loschen des altesten Eintrage 

- Loschen der kleinsten Eintrage 

- Loschen der groftten Eintrage 

- Loschen der am seltensten abgerufenen Eintrage 
Grundlage von CT-Hierarchien 

Urn einen Cache-Effekt zu erzielen, werden CTs zu einer 
Hierarchie in Baumstruktur zusammengeschaltet . Zwischen 
den einzelnen Knoten (CTs) befindet sich ein Bussystem 
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(Inter-CT-Bus) , daft jeweils einen oberen Knoten (CTs) 
mit mehreren unteren Knoten (CTs) verbindet. Dabei 
fordern untere Knoten (CTs) Daten von den oberen Knoten 
(CTs) an, die oberen Knoten senden die Daten daraufhin 
an die unteren Knoten. Die unteren Knoten tauschen 
untereinander Statusinformationen aus, dazu werden die 
Netzwerke zwischen den hoheren Knoten verwendet, die 
entsprechend die Adressen auflosen mussen. 

CT-Hierarchie und Adressierung 

CT-Hierarchien sind so angeordnet, daft zur Adressierung 
der einzelnen CTs ein Binarbaum verwendet werden kann. 
Das bedeutet, daft das niederwertigste Adressbit die 
einzelnen Blatter des Baumes kennzeichnet und jedes 
weitere Adressbit jeweils eine Hierarchieebene hoher 
selektiert. Jede CT besitzt damit eine eindeutige 
Adresse . 

Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind: 
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Soli einer Gruppe von CTs eine ubergeordnete CT 
zugeordnet werden, werden mehrere Adressbits der Gruppe 
entsprechend zusammengef aftt . 
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Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind, dabei 
befindet sich auf Ebene 0 eine Gruppe mit 8 CTs 
(Adresbit 2. .0) : 
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Der Aufbau des Binarbaumes kann eindimensional oder 
mehrdimensional erfolgen, indem pro Dimension ein 
Binarbaum aufgebaut wird. 

Eine bestimmte CT (TARGET) wird adressiert, indem die 
initierende CT (INITIATOR) entweder die exakte 
Zieladresse angibt, oder TARGET relativ adressiert. 

Die Auswertung einer relativen Adresse wird im folgenden 
nahers beschrieben: 



Beispiel eines relativen Adressfeldes fur eine 
zweidimensionale Adressierung: 
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BitlS ist gesetzt, wenn die CT der nachsthoheren 
Hierarchiestufe selektiert werden soil. 

Bitl4 kennzeichnet Broadcasts, selektiert also alle CTs. 
Die X/Y-Adressen geben die Adresse von TARGET ausgehend 
von der Adresse von INITIATOR an. 

Die Adressen sind vorzeichenbehaftete "signed" Integer- 
Zahlen. Durch Addition der Y/X-Addressen des 
Adressfeldes zu der aktuellen Adressposition, wird 
TARGET bestimmt. Jede Ebene besitzt eine bestimmte 
Adressbreite (Addresswidth) . Die Addierer entsprechen 
dieser Breite. 

Ein Uber- oder Unterlauf bei der Addition bedeutet, dali 
die adressierte CT nicht unterhalb des aktuellen Knotens 
liegt und die Adressanf orderung wird an die 
daruberliegende CT (den nachsthoheren Knoten) 
weitergegeben. 

Tritt kein Uber- oder Unterlauf auf, befindet sich 
TARGET unterhalb des aktuellen Knotens. Das auf der 
aktuellen Ebene berechnete Adressbit (vgl. Tabellen) 
selektiert den direkt unter dem aktuellen Knoten 
liegende CT. Von dieser aus wird jeweils anhand des 
entsprechend berechneten Adressbits die nachst tiefere 
CT (Knoten) selektiert. 

Priorisierung von Zugriffen in CT-Hierarchien 

Die Zugriffe auf den Inter-CT-Bus werden von einem 
Arbiter verwaltet . Dabei sind alle unteren Knoten gleich 
priorisiert. Der obere Knoten besitzt eine hohere 
Prioritat. Dadurch sind Zugriffe, die von einem hoheren 
Knoten nach unten iibertragen werden, oder bereits einen 
weiten Weg vom INITIATOR aus zuruckgelegt haben anderen 
Zugriffen uberlegen. 

Der Grundaufbau einer CT 

Die nachfolgende Ubersicht uber die CT gibt einen 
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Uberblick uber die einzelnen Baugruppen. Die detailierte 
Beschreibung der Baugruppen wird im folgenden gegeben. 

Kern einer CT ist die Steuer-Statemachine (CTS) die 
samtliche Abarbeitungen von Konf igurationsroutinen (KRs) 
steuert. Der CTS zugeordnet ist, der Garbage-Kollektor 
(GC) , der das Entfernen von KR aus dem Speicher (CTR) 
der CT steuert; das FILMO, das die Verwaltung der noch 
abzuarbeitenden KWs iibernimmt und die LOAD-Statemachine, 
die das Laden von KRs steuert. 

Der Speicher (CTR) ist als gewohnlicher Schreib-Lese- 
Speicher ausgestaltet , wobei alle technisch moglichen 
Implementierungen zum Einsatz kommen konnen, und wird 
zur lokalen Speicherung von KRs fur die jeweilige CT und 
deren untergeordnete CTs verwendet. Als Sonderfall kann 
der Speicher (CTR) auch als ROM, EPROM, EEPROM, Flash- 
ROM o.a. ausgestaltet sein, urn den Baustein mit einer 
festen, ASIC oder PLD-ahnlichen (siehe Stand der 
Technik) Funktion zu versehen. 

Zur Generierung der CTR-Adressen werden vier als ladbare 
Zahler ausgestaltete Pointer verwendet: 

1. Free-Pointer (FP) . Zeigt auf den ersten freien 
Speicherplatz hinter der letzte KR im CTR. 

2. Garbage-Pointer (GP) . Zeigt auf einen durch den 
Garbage-Kollektor (GC) zu entfernenden Eintrag aus dem 
CTR. 

3. Move-Pointer (MP). Zeigt auf eine Speicherstelle im 
CTR, von der ein gultiges, nicht zu entfernendes 
Konfigurationswort (KW) , also einen Eintrag eines KR, an 
den durch GP definierten Eintrag kopiert/bewegt wird. 

4. Program-Pointer (PP) . Zeigt auf das momentan von der 
CTS ausgefuhrten KW. 
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KW werden uber ein Ausgabe-Interf ace (OUT) an die 
zugehorenden CELs weitergegeben . Die CELs quittieren 
(ACCEPT) , sofern sie sich in einem umkonf igurierbaren 
Zustand befinden den Empfang der KW. Wird ein KW nicht 
quittiert (REJECT) , wird es in einem FIFO-ahnlichen 
Speicher (FILMO) , zeitweise zwischengespeichert, urn zu 
einem spateren Zeitpunkt, ohne den Program-Pointer zu 
benutzen, erneut an die adressierte CEL geschrieben zu 
werden. . . 

Eine Aufforderung zur Abarbeitung eines KR erhalt die 
CTS durch Triggersignale . Die Triggersignale durchlaufen 
eine Maske, das ist ein Filter, der unerwunschte Trigger 
ausfiltert (ausmaskiert ) . Eine Maske kann nach dem Stand 
der Technik durch UND-Gatter (AND) aufgebaut werden, die 
einen Trigger mit einem Freigabe-Signal UND-verknupf t . 
Die Trigger werden liber einen priorisierten Round-Robin- 
Arbiter (SCRR-ARB) in Binarsignale umgewandelt. Ein 
priorisierter Round-Robin-Arbiter verkniipft den Vorteil 
der Gleichberechtigung eines Round-Robin-Arbiters mit 
der Erkennung der nachsten Freigabe in einem Takt, also 
dem Vorteil eines Prioritats-Arbiter . 

Die maskierten Trigger werden als Adresse auf eine erste 
Lookup-Tabelle (LUT1) geschaltet, das ist ein Speicher, 
der dem als Adresse eingehenden Trigger das ID der 
betreffenden KR zuordnet und auf den Datenleitungen 
ausgibt . 

In einer zweiten Lookup-Tabelle (LUT2) wird die ID der 
KR der Adresse des Speicherplatzes der KR im CTR 
zugeordnet. Die zweite Lookup-Tabelle wird nicht nur zur 
Zuordnung von Trigger-Signalen verwendet, vielmehr 
benutzen Befehle, die eine ID als Parameter verwenden, 
die LUT2 ebenfalls zur Adress zuordnung. 
Die Zuordnung der Trigger-Signale zu den betreffenden 
IDs wird uber den nachfolgend beschriebenen Befehl 
"REFERENCE" in die LUT1 eingetragen. Die Verwaltung der 
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LUT2, also die Zuordnung der IDs zu den Adressen im CTR, 
geschieht automatisch durch die CTS und den GC. 

Zum besseren Verstandnis der CT ist im folgenden ein 
moglicher Grundbef ehlssatz dargestellt: 

1. BEGIN <ID> 

Durch BEGIN <ID> wird der Anfang einer 
Konfigurationsroutine gekennzeichnet. <ID> gibt die 
eindeutige Identif ikationsnummer der 
konfigurationsroutine an. 

2. STOP 

Durch STOP wird das Ende einer Konfigurationsroutine 
gekennzeichnet. An dieser Stelle beendet die 
Konfigurationstabelle (CT) die Abarbeitung der 
Konfigurationsroutine. Der Garbage-Kollektor (GC) 
beendet das Entfernen von Eintragen dieser 
Konfigurationsroutine . 

3. EXECUTE <ID> 

Springt zum Beginn (BEGIN <ID>) einer 
Konfigurationsroutine. Ist diese Routine nicht im 
Speicher der CT vorhanden, so wird sie von der 
daruberliegenden CT angefordert, bzw. aus dem Speicher 
geladen. 

4. LOAD <ID> 

Fordert die KR <ID> von der daruberliegenden CT an. 

5. REMOVE <ID> 

Ruft den GC auf, urn die Konfigurationsroutine <ID> von 
BEGIN <ID> bis STOP aus dem Speicher der CT zu entfernen 
und die nachfolgenden Konf igurationsroutinen so weit 
vorzuschieben, daft kein Speicherloch durch die entfernte 
Konfigurationsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> <EXIT> 

Schreibt die Konf igurationsdaten <DATA> an das Register 
<ADDRESS>. Ist <FORCED> gesetzt, werden die Daten auch 
geschrieben, wenn das RECONFIG-Flag des betreffenden 
Zielregisters nicht gesetzt ist. <EXIT> wird verwendet 
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und anzuzeigen, daft es sich urn ein KWR handelt, das bei 
einem REJECT die weitere Ausfuhrung der nachf olgenden 
KWRs abbricht. 

7. MASK <SR> <TRIGGER> 

Setzt die Trigger-Maske mit <TRIGGER>, bzw. setzt sie 
mit <TRIGGER> zuruck, abhangig von <SR> (Set/Reset) . 

8. WAIT <UNMASKED> <TRIGGER> 

Halt die Abarbeitung der Konf igurationsroutine an und 
wartet auf den Trigger <TRIGGER> . 1st <UNMASKED> 
gesetzt, wird auf das erwartete Trigger unabhangig des 
Zustandes der Trigger-Maske reagiert. 

9. TRIGGER <TRIGGER><CT#> 

Sendet den Binarwert eines Triggers an die iibergeordnete 
durch CT# adressierte CT. 

10. GETBUS/GETCTS 

Baut eine Verbindung zu dem Inter-CT-Bus auf. 

11. LOOSEBUS/LOOSECTS 

Lost die Verbindung zum Inter-CT-Bus auf. 

12. REFERENCE <TRIGGERXID> 

Schreibt in die LUT1 bei Adresse <TRIGGER> den Wert 
<ID>, wodurch einem Triggersignal eine bestimmte KR 
zugeordnet wird. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WAIT, 
TRIGGER, REFERENCE sind nur innerhalb der Klammer BEGIN 
... STOP gultig. Aufterhalb dieser Klammer werden die 
Befehle nicht ausgefuhrt. 



Der Aufbau einer Konf igurationsroutine (KR) sieht wie 
f olgt aus : 
BEGIN <ID>; 
... 

giiltige Befehle 
STOP; 
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Indirekte Addressierung (Reforenzierung) 

Das Cache-Prinzip der CT ermoglicht das 

Zwischenspeichern einer KR in einer CT, wobei die KR von 
mehreren unterschiedlichen tief erliegenden CTs Oder CELs 
genutzt werden. 

Werden von den tief erliegenden Einheiten Zugriffe auf 
das externe Interface des Bausteines (z.B. RAM, 
Peripherie) durchgef uhrt , ergibt sich die Notwendigkeit 
unterschiedliche Adressen oder Teile des externen 
Interfaces zu speichern. Dadurch wurde sich der Inhalt 
der einzelnen benotigten KRs grundlegend unterscheiden . 
Ein Caching ist nicht mehr moglich. 
Abhilfe schafft eine indirekte Referenzierung . Dazu 
werden spezielle KR (im folgenden IKR genannt) 
verwendet, die die notwendigen externen Parameter 
beinhalten und setzen. Eventuell werden uber Trigger 
andere unterschiedliche KRs in verschiedenen 
Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das 
eigentliche KR aufrufen. Lediglich die IKR sind nicht 
cachebar, wahrend die aufgerufenen KR durchaus 
einheitlich und daher cachebar sind. Es ist sinnvoll, 
die Grofle der IKR auf das absolute Minimum zu 
reduzieren, namlich ausschliefllich die externen und 
unterschiedlichen Parameter und den Aufruf der 
einheitlichen KR. 

Eine indirekte Konf igurationsroutine (IKR) ist wie folgt 
aufgebaut : 
BEGIN <ID>; 

xxx; gultige Befehle, wobei lediglich externe Peripherie 

angesteuert werden sollte, 
TRIGGER <ID>; Start-, Stop- oder Lade-Anf orderungen an 

P'eriphere Prozesse 

• • i 

GOTO <ID>; Sprung zur einheitlichen KR 
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STOP; 



Sonderfalle: 

1. WAIT_FOR_BOOT 

Dieses Kommando ist nur an der ersten Adresse des CTR 
giiltig. Wahrend des Boot-Vorganges wird zuachst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht 
die Beginnsequenz des Boot-KR BEGIN <0>. An dessen 
Stelle (auf Adresse 1) steht WAIT-FOR-BOOT, das bei 
einem RESET automatisch gesetzt wird. Erst nachdem die 
gesamte Boot-KR in das CTR geschrieben ist, wird 
WAIT_FOR_BOOT mit BEGIN <0> uberschrieben und die CTS 
beginnt mit der Abarbeitung der Boot-KR. 
WAIT_FOR_BOOT darf nicht innerhalb eines Programmes 
auftreten . 

2. BOOT <CT-ID> 

BOOT <CT-ID> kennzeichnet in welche CT die nachfolgende 
Boot-KR geschrieben werden soil. Nach BOOT <CT-ID> folgt 
kein BEGIN, die Boot-KR wird nciht durch STOP, sondern 
durch ein nachf olgendes BOOT <CT-ID> abgeschlossen. Ein 
STOP beendet den Bootvorgang. 

BOOT <CT-ID> darf nicht innerhalb eines Programmes 
auftreten. 

Boot-Vorgang 

Nach einem RESET ladt die CT des obersten Hierarchie- 
Levels (ROOT-CT) die Boot-KR in die CTs der unteren 
Hierarchien. Dazu existiert ein Sprung an eine 
festgelegte Adresse (BOOT-ADR) im, der ROOT-CT 
zugeordneten, externen Konf igurationsspeicher (ECR) . Die 
ROOT-CT fuhrt diesen Sprung durch und erreicht die Boot- 
Sequenz. Diese ist wie folgt aufgebaut: 
BOOT <CT-ID0>; COMMAND; COMMAND; ... 
BOOT <CT-ID1>; COMMAND; COMMAND; ... 
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BOOT <CT-IDn>; COMMAND; COMMAND; . . . 
STOP; 

Wahrend des Boot-Vorganges wird zunachst die komplette 
Boot~KR in das CTR ab Adresse 2 der durch <CT-ID> 
angegebenen CT geschrieben. Die Beginnsequenz des Boot- 
KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 
dessen Stelle steht WAIT-FOR-BOOT, das bei einem RESET 
automat isch gesetzt wird. Erst nachdem die gesamte Boot- 
KR in das CTR. geschrieben ist, und die ROOT-CT das 
nachste BOOT <CT-ID> erreicht hat, wird STOP an das Ende 
des Boot~KR in das CTR geschrieben und WAIT_FOR_BOOT mit 
BEGIN <0> iiberschrieben. Die CTS beginnt mit der 
Abarbeitung der Boot-KR. 

Laden einer Konf igurationsroutine 

Es existierem drei Gundmechanismen urn eine 

Konf igurationsroutine, aufcer der Boot-KR anzufordern: 

1. Ausfuhren eines LOAD <ID> durch die CTS 

2. Ausfuhren eines EXECUTE <ID> durch die CTS, wobei die 
KR mit der betreffenden ID nicht im CTR vorhanden ist. 

3. Auf tret en eines Triggers, der liber die LUT1 auf einen 
<ID> libersetzt wird, dessen zugehorige KR nicht im CTR 
vorhanden ist. 

Der Ablauf in alien drei Fallen ist derselbe: 
Die ID der angef orderten -KR wird der LUT2 als Adresse 
angegeben. Die LUT2 uberpruft, ob eine giiltige Adresse 
im CTR existiert. Existiert diese nicht, d.h. <ID> zeigt 
in der LUT2 auf den Wert 0, wird load <ID> an die CTS 
gesendet . 

Die CTS fordert daraufhin die <ID> betreffende KR bei 
der hierarchisch tibergeordneten CT an. Diese Anforderung 
erreicht die ubergeordnete CT in Form eines Triggers und 
wird entsprechend von ihr ausgewertet. 

Die ubergeordnete CT sendet die angeforderte KR an die 
anfordernde CT. Die Daten werden ab der Adresse, auf die 



23 



WO 99/44147 



PCT/DE99/00504 



der FREE-POINTER (FP) zeigt in das CTR geschrieben, 
wobei der FP nach jedem Schreibzugrif f um eins erhoht 
wird. 

Erreicht der FP die obere Grenze des CTR, wird der 
Garbage-Kollektor (GC) aufgerufen, um die unterste KR 
innerhalb des CTR zu entfernen und das CTR zu 
komprimieren. Der FP wird dabei neu gesetzt. Dieser 
Vorgang findet so lange statt, bis die zu ladende KR 
komplett in das CTR pafit. 

Sprungtabelle im Konf igurationsspeicher 

Der der ROOT-CT zugeordnete Konf igurationsspeicher 
beinhaltet samtliche KR, die fur eine Applikation 
geladen werden mussen. Im externen 

Konfigurationsspeichers (ECR) befindet sich an einer 
festgelegten Adresse (ADR-BOOT) Sprung zu der Boot- 
Konfigurations-Routine. In einem weiteren festgelegten 
Speicherbereich (LUT-ECR) beliebiger, jedoch innerhalb 
einer Applikation fest vorgegebener Lange die Spriinge zu 
den einzelnen KRs . Dabei wird die <ID> der jeweiligen KR 
als Adresse im ECR verwendet, an der die Startadresse 
der jeweiligen KR steht; wodurch KRs indirekt adressiert 
werden : 

ID ~> LUT-ECR -> KR 

Anderung der KR im Konfigurationsspeicher 

Die KR mit der ID <A> soil geandert werden. Zunachst 
schreibt der HOST die neue KR fur die ID <A> an eine 
freie Speicherstelle im ECR. Die ID <A> wird zusammen 
mit der neuen Adresse der KR im Konfigurationsspeicher 
von der iibergeordneten Einheit (HOST) in ein dafur 
vorgesehenes Register der ROOT-CT geschrieben. Die ROOT- 
CT sendet an alle darunterliegenden CTs das Kommando 
REMOVE <A>. Daraufhin entfernen alle CTs beim Erreichen 
eines STOP oder wahrend IDLE-Zyklen, also sobald keine 
KR ausgefuhrt wird, die auf diese ID bezogene KR aus dem 
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CTR und setzen die LUT2 an Adresse <A> auf "NoAdr", das 
bedeutet, es exist iert keine giiltiger Adresseintrag fur 
ID <A> in LUT2 . Wird die ID <A> erneut angef ordert, 
zwingt der fehlende Eintrag ("NoAdr") an Stelle <A> in 
die LUT2 jede CT die KR <A> vom ECR neu anzufordern. 

Das FILMO 

Ein KR besteht hauptsachlich aus dem Befehl PUSH, der 
neue Konf igurationsworte an eine bestimmte Adresse 
schreibt. 1st das Schreiben eines Konf igurationswortes 
des Types KW nicht moglich, da das adressierte 
konfigurierbare Element (CEL) nicht bereit ist eine neue 
Konfiguration zu empf angen (REJECT) , wird das 
Konfigurationswort statt an das adressierte 
konfigurierbare Element (CEL) in einen Speicher, im 
folgenden FILMO genannt, geschrieben. Die nachf olgenden 
Befehle werden normal abgearbeitet , bis erneut ein 
Konfigurationswort nicht geschrieben werden kann, das 
dann in das FILMO geschrieben wird. 

Ist das Schreiben eines Konf igurationswortes des Types 
KWR nicht moglich, da das adressierte konfigurierbare 
Element (CEL) nicht bereit ist eine neue Konfiguration 
zu empfangen (REJECT) , wird das Konfigurationswort statt 
an das adressierte konfigurierbare Element (CEL) in 
einen Speicher, im folgenden FILMO genannt, geschrieben. 
Alle nachfolgenden Befehle bis zum Ende der KR werden 
nicht an die CEL, sondern direkt in das FILMO 
geschrieben. 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausfiihren 
eines neuen KR komplett durchlaufen. Dabei wird, 
beginnend beim altesten Datenwort, entsprechend eines 
FIFOs nach dem Stand der Technik, jedes ausgelesene Wort 
des FILMOs an sein adressiertes Element zu senden; dabei 
muB das adressierte Element bereit sein das 
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Konfigurationswort zu empfangen. Sofern die Datenworter 
von Beginn an geschrieben werden konnen (d.h. die 
adressierten konf igurierbaren Elemente (CELs) sind 
bereit) wird der Eintrag aus dem FILMO nach Art eines 
FIFOs entfernt. Kann ein Konfigurationswort nicht 
geschrieben werden, wird es ubersprungen und nicht aus 
dem FILMO entfernt. Im Gegensatz zu einem FIFO werden 
die Daten nach dem ubersprungenen Konfigurationswort 
weiter ausgelesen. Konfigurationsworte, die nach einem 
ubersprungenen Konfigurationswort geschrieben werden 
konnen werden entweder je nach Implementierung des 
FILMOs 

1. als geschrieben markiert und nicht aus dem FILMO 
geloscht, wobei als geschrieben markierte 
Konfigurationsworter bei den folgenden Durchlaufen nicht 
mehr gelesen werden, bzw. sofort geloscht werden, sofern 
kein ubersprungenes Konfigurationswort mehr vor ihnen 
liegt; 

Oder 

2. aus dem FILMO geloscht, wobei die 
Konfigurationsworter vor und nach dem geloschten 
Konfigurationswort erhalten bleiben, dabei mussen zum 
Loschen die nachf olgenden Worte nach vorne (oben) oder 
die davorliegenden Worte nach hinten (unten) geschoben 
werden, wobei die Reihenfolge der Konf igurationsworte 
unbedingt beibehalten wird. 

Wird eine neue KR ausgefuhrt, werden die 
Konf igurationsworte (KW) , die von der CTS nicht an die 
adressierten Elemente (CELs) geschrieben werden konnten, 
erneut an das FILMO angehangt, d.h. die KW werden an das 
Ende (aus Leserichtung) des FILMOs geschrieben. 1st das 
FILMO voll, d.h. es exist ieren keine freien Eintrage fur 
Konfigurationsworte, wird die Ausfuhrung des KR 
gestoppt. Das FILMO wird so lange durchlaufen, bis 
geniigend Konfigurationsworte geschrieben werden konnten 
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und entsprechend viele freie Eintrage entstanden sind, 
woraufhin das KR weiter abgearbeitet wird. 
Das FILMO stellt einen FIFO-ahnlichen Speicher dar, der 
immer vom altesten Eintrag an linear durchlaufen wird, 
im Gegensatz zu einem FIFO werden jedoch Eintrage 
ubersprungen (First In Linear Multiple Out) . 

Die Funktion der Konfigurationstabellen- 
Statemachine (CTS) 

Die Konfigurationstabellen-Statemachine (CTS) ubernimmt 
die Steuerung der CT. Dabei fuhrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie ubernimmt 
die Verwaltung des FILMOs, i.b. liest sie in IDLE-Zyklen 
und vor dem Ausfuhren einer KR das FILMO aus. 
Sie reagiert auf die von der LUT-Struktur generierten 
Signalen illegal <TRG> (Illegal Trigger, siehe Fig. 1, 
0102) und load <ID>. load <ID> wird generiert, wenn ein 
Cache-Miss in LUT2 vorliegt (0105), oder die durch ID 
referenzierte KR/IKR als geloscht markiert wurde (0107) . 
Sie reagiert auf die Steuersignale der ubergeordneten 
CT. 

Ein Implementationsbeispiel fur die Verarbeitung der 
Befehle ist in den Figuren 2 bis 7 dargestellt. 

Steuersignale an ubergeordnete CTs 

- illegal <TRG> (0102) 

Zeigt der ubergeordneten CT an, dafi ein unbekannter 
Trigger <TRG> aufgetreten ist. 

- load <ID> (0105/0107) 

Fordert die ubergeordneten CT zum Laden der <ID> 

auf. 

- trigger <TRG> <CT#> (0108) 

Sendet einen Trigger <TRG> an die ubergeordnete 

Oder 

an die adressierte CT <CT#>. 



27 



WO 99/44147 



PCT7DE99/00504 



Steuersignale von iibergeordneten CTs 

- remove <ID> (siehe Fig. 15, 1513) 

Fordert die CT zum loschen der <ID> auf. 

- write_to_FP <data> (siehe Fig. 2, 0205) 

Sendet Daten an die CT. Die Daten werden an das 
Ende des belegten Speichers angehangt. 

Die Funktion des Garbage-Kollektors (GC) 

Der CTR unterliegt zwei Problemen: 

1. Verweist ein LOAD- oder EXECUTE-Bef ehls, bzw. ein 
Trigger, auf eine ID, deren KR nicht im CTR vorhanden 
ist, muft die KR nachgeladen werden. U.U. ist jedoch 
nicht geniigend Platz im CTR vorhanden urn die 
angeforderte KR zu laden. 

2. Beim Auftreten eines REMOVE <ID> ist die 
entsprechende KR aus dem CTR zu entfernen. Dabei 
entsteht, sofern sich die KR nicht am Ende des CTR 
befindet eine Lucke. Beim Laden einer neuen KR wird die 
Lucke u.U. nicht wieder ganz aufgefullt oder die Lucke 
ist zu klein fur die neue KR. Dies fiihrt zu einer 
Fragment ierung des CTR. Die Aufgabe des Garbage- 
Kollektor ist es, KR aus dem CTR zu entfernen, urn Platz 
fur neue Eintrage zu schaffen UND nach Entfernen der 
Eintrage den CTR so umzuorganisieren, daft alle 
verbleibenden KR als geschlossener Block hintereinander 
im Speicher liegen und die f reigewordenen Speicherblocke 
als ein geschlossener Block an einem Ende des CTR 
liegen. 

Dadurch konnen auf optimale Weise und ohne Verluste an 
Speicherplatz neue KR nachgeladen werden. 

Auswerten von Triggerirapulsen 

Jede CT besitzt einen Anschlufi an mehrere zu ihrer 
jeweiligen Hierarchieebene gehorenden Triggersignale, 
die zu einem Bus zusammengef afit sind. Eingehende Trigger 
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werden uber eine Maske ausgewertet, d.h. nur die 
f reigeschalteten Triggersignale werden weitergeleitet . 
Die freigeschalteten Triggersignale werden taktsynchron 
in einem Sample-Register zwischengespeichert 
(gesampled) . Ein Arbiter wahlt eines der gespeicherten 
Triggersignale aus und wandelt das Signal in einen 
binaren Vektor. Das gewahlte Triggersignal wird aus den 
Sample-Register geloscht. Der Binarvektor wird an eine 
erste Lookup-Tabelle (LUT1) weitergeleitet, die den 
Binarvektor in die Identif ikationsnummer (ID) der 
auf zurufenden Konf igurationsroutine (KR) iibersetzt. 
Die ID wird in einer zweiten Lookup-Tabelle (LUT2) in 
die Adresse der KR im CT-Speicher (CTR) iibersetzt. Die 
CT-Statemachine (CTS) setzt ihren Programm-Pointer (PP) 
auf diese Adresse und beginnt mit der Ausfuhrung der KR. 
Voraussetzung ist, dafi jeder uber die Maske 
freigeschaltete Trigger einen entsprechenden Eintrag in 
LUT1 besitzt. Fehlt dieser, wird ein Fehlerzustand an 
die CTS weitergeleitet (illegal trigger), dabei wird 
jede ID = "NoAdr" als nicht vorhandener Eintrag 
gewertet. "NoAdr" ist ein implementationsabhangig 
gewahltes Token. 

Fehlt der Eintrag in LUT2, d.h. die auf die ID bezogene 
KR befindet sich nicht im CTR, wird eine Ladeanf orderung 
an die CTS gesendet (load <ID>) . 



Senden von Triggerimpulsen an die iibergeordnete 
CT 

Neben der bereits beschriebenen Schnittstelle zu einer 
ubergeordneten CT zum Laden von KR existiert eine 
weitere Schnittstelle zum Austauschen von frei 
definierbaren Befehlen, insbesondere jedoch 
Triggervektoren. Dabei sendet eine CT 

- entweder an alle anderen CTs einen Befehl (BROADCAST) 
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- Oder an eine beliebige adressierte CT einen Befehl 
(ADDRESSED) 

Der Befehl "Triggervektor " stellt einen Binarwert dar, 
der auf einen Eintrag in der LUT2 der empf angenden CT 
referenziert . 

Das Senden von Triggervektoren ist notwendig urn 
beispielsweise innerhalb einer IKR eine KR in einer 
weiteren CT zu starten urn beispielsweise die Peripherie 
Oder den Speicher anzusteuern. 

Zur Weiterleitung von Triggervektoren an eine 
ubergeordnete CT existieren 2 Mechanismen : 

1. Der LUT1 wird ein Bit hinzugeftigt, das angibt, ob der 
Inhalt des Speichers als KR ID oder als Binarwert fur 
einen Triggerimpuls betrachtet wird. Liegt ein 
Triggerimpuls vor, wird der Dateninhalt von LUT1 direkt 
als Trigger an die ubergeordnete CT gesendet. 

2. Mit dem Befehl TRIGGER kann der Binarwert eines 
Triggers angegeben werden, der direkt an die 
ubergeordnete CT gesendet wird, (Alternativ konnten 
statt einem Triggerwert auch direkt IDs ubertragen 
werden) . 

Zum Starten einer KR in einer fremden CT uber 
Triggervektoren muA zum Erreichen der Deadlockf reiheit 
ein Synchronisationsverfahren geschaffen werden. Das 
Verfahren mufi beachten, dalJ lediglich eine KR innerhalb 
eines bestinunten Gruppe von CTs weitere KR auf anderen 
CTs innerhalb dieser Gruppe startet. Das Starten mehrere 
KR gleichzeitig kann zu einem Deadlock zwischen den CTs 
fuhren, ahnlich des bereits beschriebenen Deadlocks auf 
der CEL-Ebene. 

Das Grundprinzip eines solchen Verfahrens lauft wie 
folgt ab: 
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Ein KR ist wie folgt aufgebaut: 

GETCTS/GETBUS 
TRIGGER <ID>, <CT#> 
TRIGGER <ID>, <CT#> 

LOOSECTS/LOOSEBUS 
• • * 

Der Befehl "GETCTS" innerhalb einer KR einer CT 
(INITIATOR) zeigt an, daft im folgenden Signale an andere 
CTs (TARGET) gesendet werden. Mit Trigger <ID>, <CT#> 
wird die ID einer zu startenden KR an die CT mit der 
eindeutigen ID CT# gesendet. Das Senden des Triggers 
geschieht dabei zunachst an die direkt iibergeordnete CT, 
die entsprechend der CT# den Trigger an eine wiederum 
untergeordnete CT innerhalb ihres . CT-Raumes sendet oder 
an die ihrerseits iibergeordnete CT (siehe CT- 
Hierarchien) . Erreicht der Befehl die TARGET quittiert 
diese den Empfang. 

Beim Durchlauf des Befehls durch eine CT wird eine 
Prioritatskennung des Befehls jeweils urn eines erhoht. 
Trifft die Weiterleitungsanf orderung eines Befehls auf 
eine weitere Anforderung innerhalb einer CT, wird der 
Befehl mit der niedersten Prioritat zuruckgewiesen. 
Dadurch wird 

a) sichergestellt, daft innerhalb eines uberschneidenden 
Systemes nur ein Befehl zu einer Zeit ausgebreitet wird 
und dadurch auch nur eine KR gestartet wird, was zu der 
geforderten Deadlockf reiheit fiihrt, 

b) sichergestellt, daft der bislang am wenigsten weit 
ausgebreitete Befehl zuruckgewiesen wird, was zu einer 
Steigerung der Performance fuhren kann 

Nach Zuruckweisen eines Befehls, werden alle 
vorhergehenden Befehle innerhalb der GETCTS/LOOSECTS 
ebenfalls zuruckgewiesen, d.h. INITIATOR sendet an alle 



31 



WO 99/44147 



PCT/DE99/00504 



TARGET das Signal DISMISS und die Ausfuhrung der KR 
startet nach einer Wartezeit bei GETCTS erneut. 
Die Quittierungen aller Trigger innerhalb eines 
Befehlsabschnittes GETCTS . . . LOOSECTS werden an die 
INITIATOR-CT gesendet. Bei jeder eintref f enden 
Quittierung wird die Verarbeitung des nachsten Befehls 
fortgesetzt . 

Bei Erreichen des Befehls LOOSECTS sendet INITIATOR an 
alle TARGET das Signal GO. Dadurch starten die TARGET- 
CTs die Ausfuhrung der KR mit der von Trigger 
iibertragenen ID. 

TARGETS wechseln nach Auftreten eines Triggers in einen 
Zustand, in welchem sie auf das Auftreten eines GO oder 
DISMISS Signales warten. 

Aufgrund der besseren Implementierbarkeit wird weiterhin 
ein leicht modif iziertes Verfahren vorgestellt: 
Zwischen den CTs einer Gruppe einer Hierarchieebene 
befindet sich ein Bussystem (Inter-CT-Bus) . Dieses 
Bussystem verbindet alle CTs der Gruppe und eine direkt 
der Gruppe ubergeordnete CT. 

Durch den Befehl GETBUS, der funktionell GETCTS ahnlich 
ist, wird das Bussystem von einer CT arbitriert. Die 
Befehle werden uber das Bussystem an die CTs derselben 
Gruppe weitergeleitet . Befindet sich die adressierte CT# 
nicht innerhalb der Gruppe, wird durch die ubergeordnete 
CT automatisch deren ubergeordneter Bus arbitriert und 
der Befehl weitergeleitet. Die arbitrierten Busse 
bleiben INITIATOR zugeordnet und somit fur alle anderen 
CTs gesperrt, bis entweder eine Zuriickweisung erfolgt, 
Oder der Befehl LOOSEBUS den Bus auf lost. LOOSEBUS ist 
mit LOOSECTS vergleichbar . Vor Ausfuhren des Befehls 
LOOSEBUS wird das GO-Signales an alle beteiligten Cts 
gesendet. Dies erfolgt entweder durch den Befehl 
LOOSEBUS oder einen speziellen vorgeschalteten Befehl. 
Befehle, i.b. Trigger werden ebenfalls gemaU des bereits 
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beschriebenen Grundverfahrens verarbeitet . Eine 
Zuruckweisung erfolgt, wenn ein Bussystem nicht 
arbitriert werden kann. Beim Arbitrieren sind die CTs 
einer Ebene jeweils gleich priorisiert, die 
iibergeordnete CT besitzt eine hohere Prioritat. 
Beim Senden eines Befehls uber den Inter-CT-Bus bleibt 
der Befehl so lange aktiv, bis die adressierte CT den 
Befehl akzeptiert (ACCEPT) Oder zuruckweist (REJECT) . 

Der priorisierte Round-Robin-Arbiter 

Der priorisierte Round-Robin-Arbiter (Single-Cycle- 
Round-Robin-Arbiter SCRR-ARB) ist taktsynchron 
aufgebaut, d.h. bei jeder - je nach Implementierung 
positiven oder negativen - Taktflanke (TF1) liefert er 
ein Ergebnis. Die eingehenden Signale (ARB- IN) 
durchlauf en eine Maske (ARB-MASK) , die von dem Arbiter 
gemaft dem nachfolgend beschriebenen Verfahren selbst 
verwaltet wird. Die Ausgangssignale der Maske werden an 
einen Prioritatsarbiter (ARB-PRIO) nach dem Stand der 
Technik geleitet. Der Arbiter liefert taktsynchron bei 
jeder Taktflanke (TF1) ein Ergebnis (ARB-OUT), d.h. den 
Binarwert des hochstpriorisierten Signals nach der Maske 
(ARB-MASK) . Dem Ergebnis zugeordnet ist ein Signal 
(VALID), das angibt, ob der Binarwert gliltig Oder 
ungultig ist. Abhangig von der Implementierung der 
Prioritatsarbiters ist es moglich, daB beim Anliegen des 
Signals 0 und beim Anliegen keines Signals derselbe 
Binarwert generiert wird: In diesem Fall zeigt VALID an, 
dafi das Ergebnis ungultig ist, sofern kein Signal 
anliegt. Dieses Signal wird 

1. als Ergebnis der Arbiters ausgegeben 
und 

2. auf einen Dekoder geschaltet ," der die Binarwerte - 
wie in der folgenden Tabelle beispielsweise fur einen 3- 
bit Binarwert angeben - auskodiert. (Das 
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Kodierungsverfahren ist gemaft dieses Prinzips auf jeden 
beliebigen Binarwert anpafibar) : 



Binarwert 


Auskodierung 


Bemerkung 


(ARB-OUT) 


(ARB-DEC) 




111 


0111 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




Oil 


0000 0111 




010 


0000 0011 




001 


0000 0001 




000 


1111 1111 


Reset-Zustand und 

wenn Binarwert (ARB-OUT) ungultig 



Dem Dekoder zugeordnet ist ein Register (ARB-REG) , das 

die auskodierten Werte (ARB-DEC) des Dekoders bei der zu 

TF1 inversen Taktflanke (TF2) ubernimmt . ARB-DEC wird 

auf die Maske (ARB-MASK) zuruckgekoppelt und.schaltet 

die einzelnen Eingangssignale (ARB-IN) frei. 

Der funktionale Ablauf im Arbiter ist wie folgt: 

1. Nach einem RESET sind alle ARB-IN iiber ARB-MASK 
freigeschaltet, da ARB-DEC alle Signale auf 
"Freigabe" stellt. 

2. Das hochst priorisierte gesetzte ARB-IN 
(beispielsweise besitzt in der obigen Tabelle das 
Signal 7 (binar 111) die hochste Prioritat und 0 
(binar 000) die niederste Prioritat) wird als 
Binarwert ausgegeben. 

3. Uber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. 

4. Die folgenden Schritte 5 und 6 wiederholen sich so 
lange, bis das Signal 0 (binar 000) erreicht ist, 
oder kein Signal hinter ARB-MASK mehr anliegt. Dann 
schaltet ARB-DEC (siehe Auskodierungstabelle) wieder 
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alle Signale durch ARB-MASK iiber ARB-DEC frei und der 
Ablauf beginnt bei Schritt 2. 

5. Das nunmehr hochst priorisierte gesetzte ARB- IN wird 
als Binarwert ausgegeben. 

6. Uber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. (Weiter mit Schritt 
4) 

Dadurch wird erreicht, daft alle Eingangssignale 
gleichberechtigt behandelt werden und bei jedem 
Taktzyklus eines der Eingangssignale (ARB-IN) binar 
auskodiert und ausgegeben (ARB-OUT) wird. 
ARB-REG kann mit einem Enable-Eingang (EN) versehen 
werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulaflt, wenn ein entsprechendes Signal anliegt. 
Dadurch wird nicht bei jedem Takt ein Binarvektor 
ausgegeben, sondern abhangig von einer Freischaltung 
durch EN und TF2 . Der Eingang wird zur Synchronisation 
notwendig, wenn die nachgeordnete Schaltung die 
Verarbeitung nicht in einem Taktzyklus durchfuhren kann, 
sondern mehrere Zyklen benotigt und erst dann den 
nachsten Binarvektor akzeptiert. 

Unter Umstanden ist es sinnvoll eine Reihe von Signalen 
durch den Arbiter als hoher priorisiert anzusehen, 
wahrend die Mehrzahl der Signale gleichpriorisiert ist. 
Dies ist z.B. bei dem vorhergehend beschriebenen 
Verfahren zur Weiterleitung von Signalen zwischen CTs 
notwendig. Urn ein Signal hoher zu priorisieren, wird der 
hochstpriorisierte Anschlufc des ARB-PRIO nicht maskiert, 
d.h. an der Maske (ARB-MASK) vorbeigeleitet . Dadurch 
wird das Signal bevorzugt behandelt. 

Aufbau einer CT auf Basis eines Mikrokontrollers 

Abweichend von den bisherigen Beschreibungen kann eine 
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CT auch in einer Mikrokontrollerarchitektur 
implement iert werden. 

Es ist leicht einsehbar, dafi die Grundfunktionen, wie 
Triggersteuerung, Lookup-Tabelle LUT1 und LUT2, sowie 
die Inter-CT-Kommunikation und das Schreiben der KW an 
die CEL ohne weiteres auch von einem Mikrokontroller 
ausgefuhrt werden konnen. Lediglich der Aufbau eines 
effizienten FILMOs stellt ein Problem dar, das sich vor 
allem in der erreichbaren Performance bemerkbar macht. 
Daher wird auf den Aufbau des FILMOs gesondert 
eingegangen . 

Aufbau des FILMOs 

Der FILMO ist nicht als separater Speicher ausgestaltet . 
Vielmehr ist der gewohnliche Programmspeicher urn die 
FILMO-Funktionalitat erweitert. Dazu wird ein 
zusatzliches Bit (FILMO-BIT) jedem KW zugeordnet, das 
anzeigt, ob das entsprechende KW in die CEL geschrieben 
wurde oder nicht. Ist FILMO-BIT gesetzt, wird das 
entsprechende KW nicht ausgefuhrt, Beim Schreiben eines 
Kws in den Speicher wird das FILMO-BIT zuruckgesetzt . 
Alle KRs innerhalb einer CT werden uber eine Verkettete- 
Liste (FILMO-LIST) in der Reihenfolge miteinander 
verbunden, wie sie durch Trigger oder LOAD<ID> 
aufgerufen wurden. Eine KR bleibt so lange in der FILMO- 
LIST, bis sie komplett ausgefuhrt wurde, dann wird sie 
aus der Liste entfernt. Die FILMO-LIST wird entsprechend 
des FILMO-Verfahrens durchlaufen und stellt damit einen 
direkten Ersatz fur den FILMO-Speicher dar. 
(Der Vollstandigkeit halber sei angemerkt, dafi entgegen 
des urspriinglichen FILMO-Verfahrens keine KR zweimal in 
der Liste vorkommen kann. Wird eine KR aufgerufen, die 
noch in der FILMO-LIST steht, mufi deren Ausfuhrung so 
lange verzogert werden, bis sie aus der FILMO-LIST 
entfernt wurde. ) 
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Der Aufbau einer FILMO-Speicherstelle ist wie f olgt : 



FILMO-BIT KW 



Befehle 

Der Mikrokontroller unterstutzt die folgenden Befehle, 
die direkten Einflufi auf das FILMO haben: 
PUSH Schreiben eines KW an eine CEL 

PUSHSF Schreiben eines KW an eine CEL und setzen des 
FILMO-BITs, wenn das KW angenommen 

(ACCEPT) wurde 

PUSHRET Schreiben eines KW an eine CEL und Rucksprung 
(RETURN) aus der Unterroutine, wenn das KW 
nicht von der CEL angenommen wurde (REJECT) . 
Dieser Befehl wird verwendet, wenn 
nachfolgende KW in der KR von der 
Konfiguration dieses KWs (ACCEPT) abhangig 
sind; durch den Rucksprung aus dem KR wird 
deren Konfiguration so lange verhindert, bis 
PUSHRET erfolgreich (ACCEPT) ist. 

PUSHNR Schreiben eines KW an eine CEL, nur dann, wenn 
zuvor innerhalb der KR kein REJECT auftrat. 
Dient ahnlich wie PUSHRET dazu, Abhangigkeiten 
in der Konf igurationsreihenf olge von KWs zu 
handhaben . 

Garbage Kollektor 

Entsprechend der bisherigen Beschreibung wird ein 
Garbage-Kollektor (GC) zum Entfernen von nicht mehr 
benotigten KRs benutzt. Der GC lauft an, wenn entweder 
der Platz zum Laden einer neuen KR im Speicher nicht 
mehr ausreicht und IDs entfernt werden mussen; oder eine 
KR explizit durch den Befehl REMOVE - mit der Angabe der 
ID der zu loschenden KR - geloscht wird. 
Urn den GC-Lauf moglichst einfach zu gestalten, werden 
samtliche KRs uber eine verkettete Liste miteinander 
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verbunden. GC lauft die Liste durch und entfernt die 
nicht mehr benotigten KR, indem sie von anderen KR 
uberschrieben und die Listeneintrage entsprechend 
angepaflt werden. Dabei werden die alle verbleibenden KR 
im Speicher so verschoben, daii die durch die zu 
loschenden KR entstehende Speicherlucke geschlossen wird 
und am Ende des Speichers ein grofterer zusammenhangender 
Freiraum entsteht. 

Aufbau einer KR 

Ein moglicher Grundaufbau einer KR ist in der folgenden 
Tabelle dargestellt: 

jmp START; 

length 

garbage - previous 

garbage - next 

FILMO - previous 

FILMO - NEXT 

CACHE - statistic 
KR - statistic 
START: 



ret; 



Zu Beginn der KR erfolgt ein Sprung uber den folgenden 
Header hinweg zum Start der Bef ehlssequenzen. Es folgt 
die doppelt verkettete Liste fur den Garbage-Kollektor, 
in der samtliche KR miteinander verbunden sind. 
"length" gibt die Lange der KR an. Diese Information 
kann fur Block-Move-Bef ehle nach dem Stand der Technik 
verwendet werden, die Anwendung finden, wenn die KR im 
Speicher bewegt werden mussen (Garbage, Load, etc.). 
In der anschlieflenden doppelt verketteten Liste ist der 
FILMO aufgebaut, wobei nur die KRs miteinander verbunden . 
sind, die KWs enthalten, die noch nicht an die CEL 
geschrieben wurden. 



38 



WO 99/44147 



PCT/DE99/00504 



Es folgt eine Statistik uber das Cache-Verhalten, die 
beispielsweise die Anzahl der Aufrufe der KR (pro Aufruf 
wird der Wert urn 1 erhoht), das Alter (anhand der Anzahl 
der GC-Laufe liber die KR mefibar: pro GC-Lauf wird der 
Wert um 1 erhoht), etc. enthalt. Diese Statistik kann 
der GC auswerten, wenn aus Speicherplatzgrunden eine KR 
entfernt werden mufl. Fur das Cachen ergeben sich durch 
solche Statistiken erhebliche Vorteile. So kann 
beispielsweise abhangig vom verwendeten Cache- 
Algorithmus, entsprechend den Anf orderungen der 
Applikation, der Mikrokontroller so programmiert werden, 
dafi 

1. die alteste/neueste KR 

2. die kleinste/grofite KR (s. Eintrag "length") 

3. die am seltensten/am haufigsten aufgerufene KR 
aus dem Cache geloscht wird, wenn freier Speicher 
benotigt wird. Dabei konnen selbstverstandliche weitere 
sinnvolle Statusinf ormationen gespeichert werden. Ein 
derart selektives Cachen ist bei heute bekannten Cache- 
Strukturen nicht moglich. Insbesondere werden frei 
programmierbare Cachealgorithmen in Caches nach dem 
Stand der Technik nicht unterstutzt. 

AbschlieGend ist eine KR-Statistik vorhanden, die 
beispielsweise die Anzahl der noch nicht konf igurierten 
(REJECT) oder der konf igurierten (ACCEPT) KWs enthalt . 
Gleichzeitig kann die Adresse des ersten noch zu 
konf igurierten KW gespeichert werden. Dies hat den 
Vorteil, dali bei einem FILMO-Durchlauf direkt auf das KW 
gesprungen werden kann und nicht das komplette KR 
durchlaufen werden muG, was zu einer erheblichen 
Performancesteigerung fiihrt. 

Abschliefiend sei zu den KR angemerkt, daft die 
verketteten Liste vorzugsweise durch Eintrag der 
Vorganger/Nachfolger-ID aufgebaut werden, da damit die 
absoluten Speicheradressen ohne Probleme vom GC 
verschoben werden konnen. Innerhalb einer KR sollten nur 
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relative Sprunge anstatt absoluter Sprunge verwendet 
werden, urn Probleme beim Laden der KR und bei GC-Laufen 
zu vermeiden, da sich die absolute Adressen dabei 
verandern. 

Der Vollstandigkeit halber soli noch erwahnt werden, daA 
gemafi dem bereits beschriebenen Prinzip auch beim 
Einsatz eines Mikrokontrollers vor dem Ausfiihren einer 
neuen KR (aufgrund eines Triggers oder Befehls, auch von 
einer anderen CT aus) der FILMO durchlaufen wird und vor 
Durchlauf des FILMOs der Zustand der CEL 
(umkonf igurierbar oder nicht) gesichert wird. 

Figuren 

Die nachfolgend beschriebenen Figuren verdeutlichen 
anhand eines Implementationsbeispiels die Verwaltung von 
Konf igurationsdaten nach dem vorgestellten Verfahren: 

Figur 1: Verfahren der Adressgenerierung innerhalb der 
Lookup-Tabellen 

Figur 2-7 Abarbeitung der Befehle und Funktion der 
Statemachinen 

Figur 8: Aufbau des SCRR-ARB 
Figur 9: Aufbau der LUT1 & LUT2 

Figur 10: Aufbau der Pointerarithmetik und des CTR 

Figur 11: Aufbau eines FILMO 

Figur 12a: Hierarchische Anordnung der CTs 

Figur 12b: Senden eines Triggers zwischen den CTs 

Figur 12c, d: Methoden zum Senden eines 

Figur 13: Aufruf einer KR durch mehrere IKR 

Figur 14: Aufbau der LUT1 einer ROOT-CT 

Figur 15: Aufbau der HOST-Steuerung einer ROOT-CT 

Figur 16: Verdeutlichung des LUT und ECR Konzeptes 

Figur 17: Ablauf steuerung einer CT mittlerer 

Hierarchieebene, bzw. einer ROOT-CT 
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Figur 18: Deadlockproblematik bei der Konf iguration 
eines 2-dimensionalen Arrays (siehe Patentbeschreibung) 
Figur 19: Verdeutlichung des FILMO-Konzeptes 
Figur 20: Grundprinzip der Inter-CT-Kommunikation 
Figur 21: Implemetierungsbeispiel der Inter-CT- 
Kommunikation nach dem GETCTS-Verf ahren 
Figur 22: Implemetierungsbeispiel der Inter-CT- 
Kommunikation nach dem GETBUS-Verf ahren 
Figur 23: Busstruktur des Inter-CT-Bus 
Figur 24: Adressierung innerhalb von CT-Hierarchien 
Figur 25: GARBAGE-Liste 
Figur 26: FILMO-Liste 

Figur 27: FILMO Funktion innerhalb einer KR 

Figur 28: Speichern der Zustande vor Ausfuhren einer KR 

Oder des FILMOs. 

Beschreibung der Figur en 

Figur 1 zeigt den Ablauf der CTR-Adressgenerierung 
innerhalb einer CT. Dabei wird ein eingehender binarer 
Triggervektor (0101) in der LUT1 auf eine gultige KR 
Oder IKR ID ubersetzt. Existiert keine gultige ID, wird 
ein Signal "Illegal Trigger" generiert (0102), das 
anzeigt, daft der Trigger nicht in LUT1 bekannt ist . Das 
Signal kann als Fehlermeldung an die ubergeordnete CT 
weitergeleitet Oder ignoriert werden. Die Ubersetzung 
von "Trigger" nach "ID" wird mittels des Befehls 
"REFERENCE" in die LUT1 eingetragen. 

Eine gultige ID (0103) wird an die LUT2 weitergeleitet. 
IDs die innerhalb von Befehlen, also durch einen 
Operanden, angegeben sind (0104), treffen direkt auf die 
LUT2. Die LUT2 ubersetzt eine eingehende ID in die 
Adresse der KR/IKR innerhalb des CTR. Ist die KR/IKR 
nicht im CTR gespeichert (es liegt im Cache nicht vor) , 
wird das Signal "Miss" generiert (0105) . Ist die 
libersetzte Adresse der KR/IKR mit dem Token "NoAdr" 
markiert, wird mit "NoEntry" (0107) angezeigt, daft die 
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Adresse geloscht ist. "Miss" und "NoEntry" zeigen an, 
dafi eine Ubersetzung auf eine CTR-interne Adresse nicht 
moglich ist. Auf Grundlage dieses Signals ladt die LOAD- 
Statemachine die KR/IKR mit der entsprechenden ID von 
einer dariiberliegenden CT nach. 

Sofern eine gultige Adresse vorhanden ist, wird diese an 
die Pointerarithmetik des Adressgenerators 
weitergeleitet (0106) . In LUT1 wird ein eingehender 
binarer Triggervektor entweder in eine ID oder einen 
weiteren Triggervektor ubersetzt, wobei in diesem Fall 
der Triggervektor ausgegeben wird (0108) . 

In Figur 2 ist der Ablauf beim Laden einer KR/IKR 
dargestellt. Zunachst wird die ID (0201) der zu ladenden 
KR/IKR an die dariiberliegende CT gesendet. Daraufhin 
wird in die LUT2 an der Stelle des Eintrages fur die 
angeforderte ID der Wert des FreePointers (FP) 
eingetragen. FP zeigt auf den Eintrag hinter dem letzten 
fur eine KR/IKR genutzen Eintrag im CTR. Dies ist der 
erste Eintrag, auf den die zu ladende KR/IKR gespeichert 
wird. 

Die Statemachine wartet auf ein Datenwort von der 
driiberliegenden CT. Sobald das Wort verfugbar ist, wird 
es an die durch FP ref erenzierte Stelle geschrieben. FP 
wird inkrementiert . Zeigt FP auf einen Eintrag hinter 
dem Ende des CTR wird der erste Eintrag im CTR entfernt 
um Platz zu schaffen (0202); dabei wird FP aktualisiert . 
Ist das von der dariiberliegenen CT gesendete Datenwort 
"STOP", wird der Ladevorgang abgebrochen (0203), 
ansonsten mit dem Warten auf ein neues Datenwort 
fortgesetzt (0204) . 

In Figur 3a ist der "MASK»-Befehl dargestellt. Der 
Operand des Befehls wird in das MASK-Register 
geschrieben. Das MASK-Register befindet sich am Eingang 
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der Triggersignale vor LUT1 und maskiert ungiiltige 
Trigger aus. 

In Figur 3b wird durch den Befehl "TRIGGER" der Operand 
des Befehls als Triggervektor zu den anderen CTs 
abgesendet . 

In Figur 3c wird durch den Befehl "REFERENCE" die 
Ubersetzung eines Triggers zu der entsprechenden KR/IKR 
ID in die LUT1 geschrieben. 

In Figur 4a wir der Befehl "WAIT" dargestellt . Der 
Operand des Befehls wird in das WAITMASK-Register 
geschrieben. Alle Trigger, bis auf den/die Erwarteten 
und daher in WAITMASK f reigeschalteten werden ignoriert. 
Erst nach Auftreten des Triggers wird zum Programmf lufi 
zuruckgekehrt . 

In Figur 4b ist der "PUSH"-Bef ehl abgebildet. Das 
Konf igurationswort wird zum adressierten 
konf igurierbaren Element (CEL) gesendet. Akzeptiert das 
CEL das Konf igurationswort nicht; da das CEL sich 
beispielsweise im Zustand "nicht konf igurierbar" 
befindet; wird das Konf igurationswort in den FILMO 
geschrieben (0401) . 

Figur 5 zeigt den Ablauf eines " REMOVE" -Be fehles . Es 
gibt zwei Auf rufvarianten: 

1. Die erste im CTR liegende KR/IKR wird aus dem CTR 
entfernt. Dem GarbagePointer (GP) wird die Adresse 0 des 
CTR zugewiesen (0501) . 

2. Eine spezifisch durch ihre ID angegebene KR/IKR wird 
aus dem CTR entfernt. Dem GarbagePointer (GP) wird die 
erste Adresse des zu entfernenden KR/IKR im CTR 
zugewiesen (0502) . 

Der MovePointer wird mit dem Wert von GP geladen. GP und 
MP referenzieren auf einen "BEGIN <ID>"-Befehl im CTR, 
auch wenn die erste KR/IKR aus dem CTR entfernt werden 
soli. Die betreffende ID wird in LUT2 als ungultig 



43 



WO 99/44147 



PCT/DE99/00504 



markiert. MP wird so lange inkrementiert, bis das "BEGIN 
<ID>" des nachsten im Speicher liegenden KR/IKR erreicht 
wird (0503), ODER MP gleich dem FreePointer (FP) ist, 
das bedeutet, daft die zu entfernende KR/IKR die letzte 
im CTR ist (0504) . 

- In diesem Fall wird FP mit dem Wert von GP geladen, 
wodurch die durch die zu loschende KR/IKR belegten 
Speicherstellen als frei markiert werden; und die 
Funktion "REMOVE" ist beendet (0505) . 

- Andernfalls ("BEGIN <ID>" wird erreicht (0506)) werden 
die durch MP ref erenzierten Daten an die durch GP 
referenzierte Speicherstelle kopiert. MP und GP werden 
inkremetiert . Dieser Ablauf findet so lange statt, bis 
MP das Ende von CTR oder die Position von FP erreicht 
hat (0507) . Wird wahrend des Ablauf es durch MP eine 
Speicherstelle ref erenziert, in der "BEGIN <ID> n steht, 
wird der Eintrag fur die entsprechende ID in LUT2 mit MP 
iiberschrieben (0508), damit bei einem Lookup die 
richtige Speicherstelle ausgegeben wird. 

Figur 6 zeigt das Ablauf diagram des FILMOs. Ein FILMO 
beinhaltet drei Pointer: 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FILMO-RAM 

3. FullP: Der Zustandszeiger, der den "Fullstand" des 
FILMO-RAMs reprasentiert und einen Unterlauf, bzw. 
Uberlauf verhindert. 

Ein ein-Bit Register "BeginF" zeigt an, ob sich der 
aktuelle Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d.h. keine nicht geloschten Eintrage befinden 
sich zwischen dem Lesezeiger und dem Beginn des FILMO- 
RAMs; oder sich der Lesezeiger in der Mitte des FILMO- 
RAMS befindet (FALSE), also benutzte Eintrage zwischen 
dem Lesezeiger und dem Beginn des FILMO-RAMS liegen. 
Weiterhin existieren zwei Register zum Speichern der 
Zustande des ReadP und FullP. Es" ist notwendig beim 
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Auftreten des ersten ungeloschten Eintrages die beiden 
Register zu sichern, da bei einem spater stattf indenden 
Lesezugriff an der Stelle dieses Eintrages mit dem 
Auslesen begonnen werden mufi. Andererseits miissen jedoch 
ReadP und FullP wahrend des aktuellen Lesevorganges 
weiterhin modifiziert werden, urn die nachsten 
Leseadressen zu erhalten, bzw. das Ende des FILMO-RAMs 
festzustellen. Durch den Aufbau des FILMOs als FIFO- 

ahnliche Struktur als sogenannten Ringspeicher 

kann Beginn und Ende des Speichers nicht anhand einer 
Adresse 0 oder eine Maximaladresse festgelegt werden. 
Aus dem Grundzustand fuhren zwei Ablaufpfade: 
1. Lesepfad (0601) 

FullP und ReadP werden in die Register gesichert. 
Die Abarbeitungsschleife beginnt: 
BeginF ist TRUE. 

1st FullP gleich 0, werden ReadP und FullP aus ihren 
Registern zuriickgelesen (0602) und die Statemachine 
springt in den Grundzustand zuruck. 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, 
auf den ReadP zeigt gleich "NOP" ist, d.h. es handelt 
sich urn einen als geloscht markierten Eintrag in der 
Mitte des FILMOs. Ist dies nicht der Fall (0604) wird 
versucht den Eintrag in das konf igurierbare Element 
(CEL) zu schreiben. Gelingt dies nicht (REJECT, 0605), 
da CEL nicht umkonf igurierbar ist, wird BeginF auf FALSE 
gesetzt, FullP dekrementiert und ReadP inkrementiert . 
Die Statemachine springt an den Beginn der 
Abarbeitungsschleife (0606) . 

Gelingt das Schreiben des Eintrages an das CEL (0607), 
oder der Eintrag ist ein NOP, wird BeginF gestestet: 
BeginF TRUE (0608) : Es liegen keine ungeloschten 
Eintrage vor diesem. FullP wird inkrementiert, ReadP 
wird in dem zugeordneten Register gesichert, um den 
neuen Anfang des FILMOs f estzuhalten . FullP wird 
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gesichert urn die aktuelle Datenmenge f estzuhalten; ReadP 
wird inkrementiert . 

BeginF == FALSE (0609) : FullP wird inkrementiert und der 
aktuelle Eintrag im FILMO-RAM mit NOP uberschrieben, 
d.h. der Eintrag wird geloscht. ReadP wird 
inkrementiert . 

In beiden Fallen springt die Statemachine an den Beginn 
der Abarbeitungsschleife . 
2. Schreibpfad (0610) 

Es wird getestet, ob der FILMO-RAM voll ist, indem FullP 
auf den maximalen Wert iiberpriift wird. Ist dies der Fall 
(0611), wird in den Lesepfad gesprungen urn Platz zu 
schaf f en. 

Ansonsten wird das Datenwort in den FILMO-RAM 
geschrieben und WriteP und FullP inkrementiert. 

Figur 7 zeigt den Ablauf in der Hauptstatemachine . Der 
Grundzustand (IDLE) wird verlassen, sobald ein 

1. REMOVE-Kommando von der daruberliegenden CT auftritt 
(0701) : Der REMOVE-Bef ehl wird ausgefuhrt und die 
Statemachine kehrt nach IDLE zuriick. 

2. Ein Triggersignal zur Generierung eines Triggers 
zwischen den CTs auftritt (0702) : 

Der Trigger wird ausgegeben. 

Die Statemachine springt in den "STOP "-Bef ehl und danach 
nach IDLE zuruck. 

3. Ein Triggersignal zur Ausfuhrung eines KR/IKR <ID> 
auftritt (0703) : 

Der ProgramPointer (PP) wird mit der durch LUT2 
generierten Adresse geladen, Ist die Adresse ungultig, 
d.h. kein Eintrag fur das zu ladende KR/IKR vorhanden, 
wird dieses geladen (0704) und PP neu gesetzt. 
Die Ausfiihrungsschleife beginnt: 

PP wird inkrementiert (beim ersten Schleifendurchlauf 
wird dadurch der BEGIN <ID>-Befehl ubersprungen) , das 
Auftreten weiterer Trigger wird unterbunden, RECONFIG 
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wird gesperrt. Die Befehle werden ausgefuhrt und zum 
Beginn der Ausfuhrungsschleif e gesprungen (0707) . 
Der Befehl "STOP" wird gesondert ausgefuhrt (0705). Die 
Trigger und RECONFIG werden wieder f reigeschaltet und 
die Statemachine springt nach IDLE . 

Der Befehl "EXECUTE" wird ebenfalls gesondert ausgefuhrt 
(0706) . Die in EXECUTE <ID> angegebene ID wird in das 
ID-REG geschrieben. PP wird neu geladen und die durch ID 
angegebene KR/IKR ausgefuhrt (0708) . 

Nach einem Reset der CT wird die Grundkonf iguration in 
das CTR geladen und direkt in die Ausfuhrung der 
Grundkonfiguration gesprungen (0709) . 

Figur 8 zeigt den Aufbau eines SCRR-ARB. Die zu 
arbitrierenden Signale gelangen liber Dataln auf eine 
Maske (0801), die gemaJi der bekannten Tabelle einen 
zusammenhangenden Teil der Signale durchschaltet , bzw. 
sperrt. Ein gewohnlicher Prioritatsarbiter (0802) nach 
dem Stand der Technik arbitriert ein Signal aus der 
Menge der Durchgeschalteten und lieferte dessen 
Binarvektor (BinaryOut) zusanunen mit einer 
gultig/ungultig-Kennung (ValidOut) (ebenfalls gemaft dem 
Stand der Technik) als Ausgang des SCRR-ARB. 
Dieses Signal wird gema£ der bekannten Tabelle dekodiert 

(0803) und auf ein Register zur Taktsynchronisierung 

(0804) gefuhrt. Uber dieses Register wird die Dataln 
Maske geschaltet. Dabei wird das Register entweder durch 
einen Takt oder ein Next-Signal (Enable EN) , das den 
nachsten gultigen Binarvektor abfragt gesteuert. Bei 
einem Reset oder wenn die Kennung (ValidOut) ungultig 
anzeigt wird das Register so geschaltet, daft die Dataln 
Maske alle Signale durchschaltet. 

Der Aufbau der Maske ist in 0805 dargestellt. In 0806 
ist die Maske ein weiteres Mai abgebildet, dabei sind 
die Signale Dataln 0.. Dataln 1 gemafi des SCRR-Prinzips 
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gleichpriorisiert, wahrend Dataln m . . Dataln n 
hoherpriorisiert sind. 

In Figur 9 ist die LUT-Struktur abgebildet. Der 
Binarvektor (Binaryln) des arbitrierten Triggers wird 
auf den Adresseingang der LUT1 (0901) gefuhrt. 
LUT1 ubersetzt den Binarvektor entweder in einen 
gtiltigen Trigger um diesen an eine andere CT 
weiterzuleiten oder eine'gultige ID. Beide werden uber 
0910 ausgegeben. 0911 zeigt an, ob es sich um einen 
Trigger oder eine ID handelt. 

1st uber den Befehl "REFERENCE" keine Ubersetzung des 

eingehenden Binarvektors in LUT1 eingetragen, wird 

mittels eines Biteintrages oder eines Vergleichers auf 

ein bestimmtes Token (z.B. "VOID") das Signal 

"Illegal Trigger" 0914 generiert. 

Ein Trigger wird uber 0912 an externe CTs gefuhrt, IDs 
werden uber den Multiplexer (0902) weiterverarbeitet . 
0902 schaltet entweder der Datenausgang von LUT1, der 
eine giiltige ID angibt, oder das ID-Register (0903) der 
CT auf den Adresseingang der LUT2 (0904) , 0904 besitzt 
eine Cache-ahnliche Struktur, d.h. der niederwertige 
Teil (0906) des Datenausgangs von 0902 wird auf den 
Adresseingang von 0904 geschaltet, wahrend der 
hoherwertige Teil (0907) auf den Dateneingang von 0904 
geschaltet wird. Der 0907 gehorende Datenausgang wird 
iiber einen Komparator (0905) mit 0907 verglichen. Der 
Vorteil dieses Verfahrens ist, dafi 0904 nicht die Tiefe 
zur Ubersetzung aller IDs aufweisen mufl, sondern 
erheblich kleiner ausf alien kann. Ahnlich eines 
gewohnlichen Caches wird lediglich ein Teil der IDs 
ubersetzt, wobei in der LUT2 anhand 0907 festgestellt 
werden kann, ob die selektierte ID der von LUT1 
angegebenen entspricht. Dies entspricht einem Cache/TAG- 
Verfahren nach dem Stand der Technik. 
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Einem zweiten Dateneingang von 0904 ist ein Multiplexer 

0908 zugeordnet, der je nach Operation den FreePointer 
(FP, Operation LOAD) , den GarbagePointer (GP, Operation 
REMOVE) Oder eine Invalid-Kennung/Token (NoAdr, 
Operation REMOVE) zur Speicherung an LUT2 liefert. Die 
beiden Pointer referenzieren auf Speicherstellen im CTR, 
"NoAdr" gibt an, daft kein Eintrag zu der passenden ID 
existiert, der Eintrag geloscht wurde. Dies wird am 
Datenausgang f estgestellt , indem uber den Vergleicher 

0909 die Daten auf das Token "NoAdr" verglichen werden. 
An die Statemachine wird weitergeleitet : 

- Das Auftreten eines Binarvektors wird uber "Validln" 
(vgl. Figur 8) . 

- Die Angabe ob es sich bei der Ubersetzung in LUT1 urn 
einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out") . Trigger werden liber 0912 an andere CTs 
weitergeleitet, IDs werden in der eigenen CT 
abgearbeitet und an die LUT2 weitergeleitet. 

- Das Ergebnis von 0905, das angibt, ob die 
entsprechende ID in 0904 gespeichert ist ("Hit/Miss 
Out") . 

- Das Ergebnis von 0909, das angibt, ob die 
entsprechende ID auf eine gultige Adresse im CTR zeigt 
("NoEntry Out") . 

Die von 0904 generierte Adresse wird an das CTR 
weitergeleitet ("CTR Address Out"). 

Die LUT1 wird iiber den Befehl "REFERENCE" mit der 
Ubersetzung des eingehenden Binarvektors auf einen 
Trigger oder ID geladen. Die Operanden des Befehls 
werden iiber den Bus 0913 an die LUT1 gefuhrt. Uber , 
denselben Bus wird das ID-Register (0909) geladen. 

Figur 10 zeigt die Pointerarithmetik des GarbagePointer 
(PG) , ProgramPointer (PP) , MovePointer (MP) und 
FreePointer (FP) . Jeder Pointer besteht aus einem 
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getrennt ansteuerbaren ladbaren up/down-Zahler . Jeder 

Zahler kann sofern notwendig mit dem Wert jedes 

anderen Zahlers geladen werden; ebenso wie mit der 

Ausgabe von LUT2 (1007) . 

Uber Vergleicher wird festgestellt ob 

1. PP gleich MP 

2. MP gleich FP 

3. FP gleich der maximalen Position im CTR 
ist. Die Ergebnisse werden zur Steuerung der 
Statemachines verwendet . 

Uber einen Multiplexer (1001) wird einer der Pointer zum 
Adresseingang des CTR geleitet. Die Daten gelangen uber 
einen Multiplexer (1002) entweder von der ubergeordneten 
CT (1005) oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (1006) werden uber einen 
Multiplexer (1004) entweder die Daten von der 
ubergeordneten CT oder des CTR weitergeleitet . Dabei 
wird beim Auftreten eines REMOVE-Be f eh 1 s von der 
ubergeordneten CT der direkt liber 1004 an die 
Statemachine geleitet, wahrend ansonsten die Befehle aus 
dem CTR an die Statemachine gefuhrt werden. Das Register 
1003 dient zur Speicherung und Ruckkopplung von Befehlen 
auf den CTR Eingang, die wahrend eines Durchlaufs. des 
Garbage-Kollektors von einer Adresse an eine andere 
geschoben werden. 

Der Aufbau eines FILMOs ist in Figur 11 dargestellt. Die 
Daten gelangen von dem CTR (1101) in das FILMO und 
werden entwerder uber den Multiplexer (1102) in das 
FILMO-RAM (1103) geschrieben oder uber den Multiplexer 

(1104) an die konf igruierbaren Elemente (1116) gesendet. 
Werden Daten in 1103 geloscht, wird uber 1102 eine 
"N0P"-Token nach 1103 geschrieben. Uber den Vergleicher 

(1105) am Datenausgang wird das "NOP"-Token erkannt und 
ein Schreiben zu den konf igurierbaren Elementen 
verhindert. Uber den Multiplexer 1106 wird entweder der 
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Schreibzeiger WriteP (1107) oder der Lesezeiger (1108) 
an den Adresseingang von 1103 gefuhrt. In dem Register 
1109 wird der Lesezeiger gesichert urn ein Rucksetzen 
(siehe Figur 6) zu ermoglichen. 

Der Fullstandszahler Full (1110) von 1103 wird gemafl 
Figur 6 in dem Register 1111 zum Rucksetzen gespeichert. 
Zwei Vergleicher testen, ob 1103 leer (1112) oder voll 
(1113) ist. Uber den Multiplexer 1115 wird selektiert, 
ob die Steuersignale der Statemachine (von 1101) oder 
des FILMOs an 1116 gesendet wird. 

Figur 12a zeigt den hierarchischen Aufbau der CTs. Alle 
CTs beziehen ihre Daten aus der ROOT-CT (1201) und dem 
ihr zugeordneten ECR (1204) . Fur jede 

Implementierungsebene in einem Baustein existiert eine 
oder mehrere CTs. Jede CT ist fur die Verwaltung ihrer 
Ebene und der darunterliegenden CTs zustandig. Es ist 
nicht notwendig, daft alle Aste das Baumes gleich tief 
sind. Beispielsweise konnen weniger Ebenen zur Steuerung 
der Peripherie (1202) eines Bausteines existieren als 
zur Steuerung der Arbeitseinheiten (1203) . Der 
Datentransfer erfolgt baumartig. Jede CT arbeitet als 
Cache fur alle unter ihr liegenden CTs. 
Figur 12b zeigt den Triggerflufi zwischen den CTs. 
Wahrend der Datenflufi baumartig verlauft, ist der 
Triggerflufi nicht festgelegt. Jede CT kann an jede 
andere einen Trigger senden. Fur gewohnlich findet ein 
Triggeraustausch nur von den Blattern (1203) in Richtung 
der ROOT-CT (1201) statt . Unter Umstanden kann der 
Transfer jedoch auch in die entgegengesetzte Richtung 
verlaufen. 

In Figur 12c ist ein Triggervektor Broadcast 
dargestellt, wobei 1205 einen Triggervektor an alle CTs 
sendet . 
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Figur 12d zeigt einen HIGHER-Triggervektor, den 1206 an 
die uber ihr liegende CT sendet . 1207 sendet einen 
LOWER-Triggervektor an alle unter ihr liegenden CTs. 
1208 iibertragt einen direkt adressierten (ADDRESSED) - 
Triggervektor an eine bestimmte CT, die nicht direkt mit 
1207 verbunden ist. 

In Figur 13 fordern zwei unabhangige IKR n und m eine 
gemeinsame, in der daruberliegenden CT gecachte KRx an. 
Es ist angedeutet, daft diese KR von dem gesamten Ast 
gecachet wird und auch in einem Nachbarast (1301) uber 
eine gemeinsame CT verfugbar ist. 

Figur 14 zeigt ein gegenuber Figur 9 modif iziertes LUT- 
System, das in ROOT-CTs und CTs mittlerer 
Hierarchieebenen verwendet wird. Der grundlegende 
Unterschied zu den bislang beschriebenen CTs ist, dafi 
anstatt einzelner Triggersignale ID- und/oder Trigger- 
Vektoren von der CT verwaltet werden mtissen. Jedem 
Vektor ist dabei ein Handshake-Signal (RDY) zur Anzeige 
der Gultigkeit des Vektors zugeordnet, die an einen 
Arbiter (1401) geleitet werden. Uber die Multiplexer 
(1402, 1403) wird entweder einer der Triggervektoren 
(1404) Oder einer der ID-Vektoren (1405) ausgewahlt . 
Triggervektoren gelangen direkt auf den Adresseingang 
der LUT1 (1406), die ansonsten gemafi Figur 9 beschaltet 
ist. Das ID-Register (1407) ist ebenfalls gemaft Figur 9 
beschaltet. Im Gegensatz zu Figur 9 besitzt der 
Multiplexer 1408 drei Eingange (vgl. 0902). Der 
Multiplexer wird dabei auiier von der Statemachine 
zusatzlich von dem Arbiter 1401 angesteuert . Uber den 
zusatzlichen Eingang werden ID-Vektoren iiber 1403 direkt 
an die LUT2 weitergeleitet . Dazu dient der Bus 1409. 
(Prinzipiell konnen auch bei CTs gemafi Figur 9 IDs gemaA 
einem Multiplexer (1408) direkt auf die LUT2 geschaltet 
werden. Die IDs konnen dann ohne Ubersetzung direkt von 



52 



WO 99/44147 



PCT/DE99/00504 



den CEL an die LUT2 gesendet werden.) "Trigger/ID Out" 
wird gemaA Figur 9 generiert. Ein "Validln" Signal, das 
gemaft Figur 9 auf ein "Valid Out" weitergeleitet wird 
existiert nicht. Statt dessen wird je nach Arbitrierung 
durch 1401 ein "Valid Trigger Out" fur Triggervektoren 
und ein "Valid ID Out" fur ID-Vektoren generiert, um die 
Statemachine anzuweisen, wie die Verarbeitung 
stattzuf inden hat. 

Der Bus 1409 wird liber 1410 an eine weitere Einheit 
geleitet, die nur in der ROOT-CT existiert und in Figur 
15 beschrieben ist. 

Eine ROOT-CT benotigt zusatzlich zu den normalen CT- 
Funktionen ein Interface zu dem externen 
Konf igurationsspeicher (ECR) , sowie den erf orderlichen 
Adressgenerator und Einheiten zum Verwalten der Zugriffe 
auf den ECR. 

Eine gewohnliche CT iibersetzt in LUT1 eingehende 
Triggervektoren auf einen ID und in LUT2 das ID auf eine 
Speicherstelle im CTR (siehe Figur 16a) . Eine ROOT-CT 
Iibersetzt bei Zugriffen auf das ECR eine ID innerhalb 
des ECR auf eine Adresse im ECR, an der das durch ID 
referenziert KR/IKR beginnt . Dazu ist ein 
Speicherbereich im ECR festgelegt, dessen Grofle der 
moglichen Anzahl an IDs entspricht (ist beispielsweise 
eine ID 10-bit breit, ergibt das 2 10 = 1024 mogliche IDs, 
also werden 1024 Eintrage im ECR reserviert) . In den 
folgenden Beispielen befindet sich dieser 
Speicherbereich am unteren Ende des ECRs und wird LUT- 
ECR genannt, um die Ahnlichkeit zur LUT2 zu 
unterstreichen. Die Ubersetzung eines Triggers auf eine 
ID findet dabei gemafi den bereits bekannten CTs in der 
LUT1 statt (1601) . Zum besseren Verstandnis verdeutlicht 
Figur 16b den Zugriff auf das ECR. 
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Eine ID gelangt in Figur 15 liber den Bus 1410 auf Figur 
14 an den Multiplexer 1501. Uber 1501 wird die ID in den 
ladbaren Zahler 1502 geschrieben. Der Ausgang von 1502 
fuhrt uber einen Multiplexer 1503 an den Adressbus 
(1504) des ECR. Uber den Datenbus 1505 gelangt die 
Ubersetzung der ID auf eine Speicheradresse uber einen 
Multiplexer/ Demultiplexer (1506) an 1501, der 1502 mit 
der Speicheradresse ladt. Daraufhin werden uber die 
Statemachine LOAD-ECR (siehe Figur 17) die Datenworter 
der entsprechenden KR/IKR aus dem ECR gelesen und in das 
CTR geschrieben, wobei 1502 nach jedem Lesevorgang 
erhoht wird; so lange, bis der Befehl "STOP" gelesen 
wurde . 

Uber das Interface 1507 schreibt der ubergeordnete HOST 
uber 1503/1506 die KR/IKR in das ECR. Dabei wird uber 
die Statemachine (CTS) arbitriert, ob der HOST oder die 
ROOT-CT Zugriff auf das ECR hat. 

Nach einem Reset des Bausteines muii eine 
Grundkonfiguration (BOOT-KR) geladen werden. Dazu wird 
eine feste Speicheradresse (BOOT- ADR) eingefuhrt, die 
auf die erste Speicherstelle der BOOT-KR zeigt. Als 
BOOT-ADR wird die Speicherstelle Oh empfohlen, sofern 
die IDs bei 1 beginnen, andernfalls kann 2 ID oder irgend 
eine andere Speicherstelle verwendet werden. In dem 
Ausfuhrungsbeispiel wird 2 ID verwendet. 

Die ROOT-CT fuhrt zum Laden der BOOT-KR an der Stelle 
BOOT-ADR einen Lookup durch, sofern eine BOOT-KR geladen 
ist. Die ROOT-CT schreibt die Daten nach 1502 urn von 
dort die BOOT-KR bis zum Auftreten eines "STOP" Befehls 
zu laden. 

Eine Uberwachungseinheit innerhalb der ROOT-CT ubernimmt 
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die Synchronisation des HOST mit dem Baustein. Dies 
geschieht folgendermaften: 

Die Adressen kleine 2 ID werden durch 1508 uberwacht, d.h. 
bei Zugriffen auf diese Adressen durch den HOST wird ein 
Signal (ACC-ID) an die Statemachine (CTS) gesendet . 
Ebenfalls wird BOOT-ADR iiber 1509 uberwacht und sendet 
ein Signal ACC-BOOT an die Statemachine (CTS) . 
Die Statemachine (CTS) reagiert wie folgt: 

- Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden 
der BOOT-KR. 

- Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, 
wird dies iiber den Komparator. 1510 festgestellt und 
bewirkt das Anhalten des Bausteines. 

- schreibt der HOST auf eine Adresse kleiner 2 ID wird die 
Adresse in das REMOVE-Register (1511) geladen. Da die 
Adresse der ID entspricht (siehe ECR-LUT) steht die ID 
der geanderten KR/IKR in 1511. An alle CTs wird der 
Befehl REMOVE <ID> zur sofortigen Ausfuhrung gesendet 
(1513) . Die CTs loschen daraufhin die KR/IKR der 
entsprechenden ID aus ihrem CTR, bzw. LUT2 . Bei einem 
nachfolgenden Aufruf der KR/IKR miissen die CTs 
zwangslaufig die neue KR/IKR aus dem ECR laden. 

Figur 17 zeigt den Ablauf in einer ROOT-CT bei Laden 
einer KR/IKR aus dem ECR. Befindet sich eine ID nicht im 
internen CTR (vgl. Figur 1, 1701) wird die ID in den 
Zahler 1502 geschrieben (1703) . Ein Zugriff auf das ECR 
mit der Adresse in 1502 liefert die Basisadresse der 
KR/IKR. Diese wird in 1502 geschrieben (1704). Ein LOAD 
gemafl Figur 2 findet statt (1702) . Dabei werden die 
Daten statt von einer Ubergeordneten CT aus dem ECR 
gelesen (1705) und nicht nur in das eigene CTR 
geschrieben, sondern an die untergeordnete CT gesendet 
(1706) . 
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In einer CT mittlerer Hierarchieebene lauft die 
Ubersetzung der Trigger ahnlich Figur 1, mit der 
Ausnahme, daft Triggervektoren und ID-Vektoren gemaft 
Figur 14 behandelt werden. Die KR/IKR werden gemali Figur 
2 geladen, mit der Ausnahme , daft die Datenworte nicht 
nur in das eigene CTR geschrieben werden (0210), sondern 
gleichzeitig an die untergeordnete CT gesendet werden. 

Figur 19 verdeutlicht das FILMO Prinzip. Der FILMO 
(1901) wird bei lesenden und schreibenden Zugriffen 
immer vom Anfang zum Ende durchlaufen (1902) . Werden 
Eintrage vom Anfang des FILMOs geschrieben und geloscht 
(1903), wird der Lesezeiger auf den ersten ungeloschten 
Eintrag verschoben (1904) . Werden Eintrage aus der Mitte 
das FILMOs geschrieben (1905), bleibt der Lesezeiger 
unverandert (1906), die Eintrage werden mit "NOP" 
markiert (1907) . Werden Daten in das FILMO geschrieben 
(1908), werden diese am Ende, hinter dem letzten Eintrag 
angehangt (1909) . Der Lesezeiger (1910) bleibt 
unverandert . 

Selbstverstandlich kann eine CT mit nur einem Speicher, 
der LUT1, LUT2 und CTR umfaftt aufgebaut werden. Die 
Steuerung dafur ist jedoch aufwendiger. Die CTs sind 
dabei ahnlich der ROOT-CT aufgebaut, die bereits die 
LUT2 UND das CTR im ECR integriert . Fur das Verstandnis 
des Verfahrens ist eine Beschreibung dieser CTs nicht 
erforderlich. 

Wird eine CT als Cachesystem fur Daten eingesetzt, 
werden Trigger zum Schreiben von Daten in das CTR 
eingefiihrt. Dabei werden die Daten von einer CEL in das 
CTR geschrieben. Die hierzu notwendigen Anderungen sind 
trivial, das FILMO kann komplett ent fallen. 
Beim Cachen der Daten tritt das Problem der 
Datenkonsistenz auf. Dies kann umgangen werden, indem 
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ein Verfahren gemaA DE 42 21 278 Al eingesetzt wird, um 
die Daten und deren Gultigkeit in den einzelnen 
Hierarchieebenen zu kennzeichnen . Werden Daten zur 
Durchfuhrung eines Read-Modif y-Write-Zyklusses (RMW- 
Zyklus) angefordert, werden die Daten auf alien 
Hierarchieebenen anhand eines zusatzlichen Eintrages in 
dem CTR/ECR als "ungultig" (INVALID) gekennzeichnet . In 
den Eintrag kann dazu die eindeutige ID der die Daten 
benutzenden KR/IKR eingetragen werden. Die Daten konnen 
so lange von keiner KR/IKR mit anderer ID benutzt 
werden, bis die die Daten benutzende KR/IKR die Daten 
zuruckgeschrieben (vgl . Write-Back-Methode nach dem 
Stand der Technik) und ihre ID geloscht hat. 

Figur 20 zeigt ein Ausf uhrungsbeispiel : 

In Figur 20a fordert die CT 2007 Daten von der 

daruberliegenden CT an, diese fordert die Daten von der I 
ROOT-CT 2004; mit der Datenanf orderung wird die ID der 
Anfordernden KR/IKR (2001) ubertragen. Die Daten (2002) 
werden an 2007 gesendet. Alle anderen, spateren Zugriffe 
werden abgewiesen (2003) . 

In Figur 20b werden die Daten zuruckgeschrieben (2005), 
anderen, spateren Zugriffe werden wieder akzeptiert 
(2006) . 

In Figur 20c werden Daten von einer CT raittleren 
Hierarchie angefordert, im Besitz der Daten ist und 
diese an 2007 sendet. Die ID zum Sperren der Daten wird 
an alle CTs in der Hierarchie gesendet (2001) . Beim 
Riickschreiben der Daten (Write-Back) in Figur 20d werden 
die Daten an alle CTs in der Hierarchie geschrieben und 
die ID geloscht. 

Figur 21 zeigt die Kommunikation einer INITIATOR CT 
(2101) uber mehrere Zwischen-CTs (2104, 2105, 2106) mit 
einer TARGET CT (2102), sowie die direkte Kommunikation 
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ohne Zwischenebenen mit einer TARGET CT (2103) nach dem 
GETCTS/LOOSECTS-Verf ahren . 

2101 baut eine Verbindung zu 2103 auf . Nach 
erfolgreichen Aufbau erhalt 2101 von 2103 einen GRANT 
als Bestatigung des Aufbaus. Danach baut 2101 uber 2104, 
2105, 2106 die Verbindung zu 2102 auf. Die Verbindung zu 

2102 wird erst bestatigt (GRANT), wenn 2102 erreicht 
ist . 

1st die Verbindung nicht aufbaubar, da einer der Busse 
belegt ist, wird ein REJECT an 2101 gesendet und 2101 
bricht den Vorgang ab. Das bedeutet, daft auch die 
Verbindung zu 2103 abgebrochen wird und ein REJECT an 

2103 gesendet wird. 

Bestatigt 2102 jedoch die Verbindung mit GRANT, sendet 

2101 an 2103 und 2102 eine GO-Befehl, um gleichzeitig 
2103 und 2102 den gelungenen Busaufbau und die 
Synchonisation zu bestatigen. Durch dieses Protokoll 
sind Daten oder Befehle synchron und deadlockfrei 
iibertragbar, da uber GO sichergestellt ist, daft alle 
TARGET die Befehle korrekt empfangen. 

Figur 22 zeigt den Ablauf der Inter-CT-Kommunikation 
nach dem GETBUS/LOOSEBUS-Verf ahren. Wahrend im Verf ahren 
gem. Fig. 21 die jeweils ubergeordneten CTs die 
steuernde und priorisierende Aufgabe besitzen, wird die 
Steuerung hier von den Inter-CT-Bussen (2201) 
ubernommen . 

Eine Verbindung zu 2103 wird aufgebaut, indem die 
INITIATOR-CT (2101) ihren lokalen Inter-CT-Bus anfordert 
(2202) . Anforderungen werden bestatigt, wenn der Bus 
frei ist (ACCEPT) oder zuruckgewiesen, wenn der Bus 
belegt ist (REJECT) . Danach sendet sie die Adresse von 

2102 auf den Bus. Gemaft dem Adressierungsschema erkennt 
die Bussysteuerung, daft die Adresse aufterhalb der 
lokalen Busadressen liegt und baut uber die 
ubergeordnete CT 2104 eine Verbindung zu deren lokalern 
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Bus auf (2203) . Da die Adresse von 2102 in dessen 
Adressbereich liegt, wird iiber 2106 die Verbindung zum 
lokalen Bus von 2102 aufgebaut (2204) . Da 2101 nunmehr 
alleiniger Busmaster samtlicher fur die 
Datenkommunikation erf orderlicher Busse ist, ist 
sichergestellt, daft eine reibungslose deadlockf reie 
Kommunikation ablauft, da die Kommunikationskanale ftir 
alle anderen CTs gesperrt sind. Auch 2102 und 2103 
konnen die Busse nicht benutzen, da diese in ihrer 
TARGET-Rolle nur Befehle empfangen konnen und nur auf 
Anforderung durch den INITIATOR (2101) selbst Daten 
senden konnen. 

Sobald die Kommunikation beendet ist, werden die Busse 
durch ein Signal von 2101 abgebaut. 

Trifft 2101 wahrend des Busaufbaus auf einen benutzten 
Bus, wird ein REJECT an 2101 gesendet und 2101 baut die 
Bussysteme wieder ab und versucht den Aufbau zu einem 
spateren Zeitpunkt erneut. Forderen mehrere CTs 
gleichzeitig denselben Bus an, so ist die iiberliegende 
CT hoher priorisiert (2205) . Damit wird vermieden, dafl 
ein weit f ortgeschrittener Busaufbau, der bereits iiber 
mehrere Ebenen lauft von einem noch sehr lokalen 
Busaufbau abgebrochen wird. 

Durch ein erweitertes Protokoll ist es moglich im Falle 
eines REJECTS nur die Busse abzubauen, die von dem hoher 
priorisierten Busaufbau benotigt werden. Dies kann zu 
einer erheblichen Perf ormancesteigerung fiihren, da nicht 
alle Busse zu einem spateren Zeitpunkt neu aufgebaut 
werden miissen. 

Der Aufbau des Inter-CT-Busses fur das Verfahren gem. 
Fig. 22 ist in Figur 23 dargestellt. Die CTs 2301-2304 
sind iiber ihre Interface (2308-2311) zusammen mit der 
iibergeordneten CT 2305 (Interface 2307) an den Inter-CT- 
Bus 2312 angeschlossen. Die Aufschaltung auf den Inter- 
CT-Bus geschieht iiber einen Round-Robin-Arbiter, der 
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2308-2311 gleich priorisiert und 2307 hoher priorisiert, 
der einen Multiplexer zum Zusammenschalten der Busse 
ansteuert (2306) . Dem Arbiter zugeordnet ist ein 
Statemachine, die die Steuersignale (z.B. Auf/Abbau, 
ACCEPT, REJECT . . . ) auswertet . 

Figur 24 zeigt den Aufbau des Adresschemas eines 
eindimensionalen CT-Baumes. Die Rechtecke symbolisieren 
eine CT . Dabei ist die Adresse der CT eingetragen. - 
kennzeichnet unrelevante Adressbits, die nicht 
ausgewertet werden, die relevanten Adressbits sind mit 
binarer 0 oder 1 angegeben, * steht fur jedes beliebige 
Adressbit. Es ist leicht nachvollziehbar, daft durch 
Projektion dieses Schema auf mehrdimensionale Baume 
ebenso angewendet werden kann, dabei stellen die 
angegebenen Adressen jeweils eine der Achsen dar; mit 
anderen Worten, pro Achse existiert ein entsprechendes 
separates Adressystem. 

Figur 24a zeigt die Adressierung von CT 0001 aus. Dabei 
ist die relative Adresse -1 angegeben. Durch die 
Berechnung -1+1 - 00 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene"), kann die CT 0000 
berechnet werden, die auf denselben lokalen Bus 
geschaltet ist. 

In Figur 24b ruft die CT 0010 die relative Adresse +10 
auf. Die Berechnung 10+0 = 10 ("relative Bewegung" + 
"Adresse der INITIATOR-CT auf aktueller Ebene") ergibt 
den Ubertrag 1, da der Adressbereich des niedersten 
lokalen Busses genau ein Bit breit ist. Dadurch wird der 
nachst hohere Bus selektiert. Dessen Adressberechnung 
ergibt mit 10+10 - 100 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene") erneut einen 
Ubertrag, da dessen Adressbereich mit 2 Bit urn genau 
eins grofier ist, als der Adressbereich des niedersten 
Busses. Auf der nachsthoheren Ebene tritt bei der 
Berechnung 10 + 010 = 0100 kein Ubertrag auf, sodafl das 
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3. Bit (von links) den Pfad 1** mit der nachst tieferen 
Ebene adressiert, das 2. Bit (von links) den Pfad 10* 
der wiederum nachst niedersten Ebene adressiert- und 
schlieiilich das letzte Bit die TARGET-CT selektiert. 
Figur 24c zeigt das bekannt Verfahren uber 2 Ebenen in 
positive Richtung und Figur 24d zeigt das Verfahren uber 
drei Ebenen in negativer Richtung mit negativem 
Uberlauf . 

Figur 25 zeigt den Aufbau eines 2-dimensionalen CT- 
Baumes. Auf der untersten Ebene (2502) befinden sich 2- 
dimensional angeordnet die CTs (2501) . Die Adresse der 
Dimension ist mit x/y in der jeweiligen CT angegeben. 
2502 iibergeordnet ist die nachsthohere Ebene (2504) . 
Deren CTs (2503) steuern jeweils eine Gruppe von 4 CTs 
der Ebene 2502. Der Adressraum der CTs auf 2504 ist urn 
ein Bit weiter, * kennzeichnet die Adressbits der Ebene 
2502, die fur die Selektion der CTs auf 2504 irrelevant 
sind. 2504 iibergeordnet befindet sich die ROOT-CT 2505. 
Deren Adresse ist wiederum urn ein Bit weiter, die 
Bedeutung von * ist Equivalent. 

Figur 26 zeigt die Verkettung des Garbage-Kollektors bei 
der Mikrokontroller-Implementierung. Dabei sind 
samtliche KRs miteinander uber die Headereintrage 

(garbage-previous/garbage-next) miteinander verkettet. 
Beim Durchlaufen des Garbage-Kollektors durch die Liste, 
wird das Alter der KR durch Erhohen des Eintrages urn 

(+1) fur die Cache-Statistik (2602) protokolliert . Der 
Garbage-Kollektor achtet auf den Eintrag KR-Statistik 

(2601), der anzeigt, ob die KR noch in der FILMO-Liste 
hangt. In diesem Fall darf die KR nicht von GC geloscht 
werden, da sie noch unkonf igurierte KW enthalt. 
Alternativ konnte dieser Test auch uber die Eintrage 
FILMO-next und FILMO-previous ablaufen. 
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In Figur 27 ist die Verkettung der FILMO-Liste 
dargestellt . 

Dabei kann die Verkettung eine vollkommen andere als in 
der Garbage-Liste (Fig. 26) sein. Die KRs sind uber 
FILMO-previous und FILMO-next verkettet. Die Eintrage 
KR-Statistik (2701) zeigen auf das jeweils erste noch 
nicht konfigurierte KW in der jeweiligen KR. Ein FILMO- 
Lauf gestaltet sich derart, dafl in der ersten ID die KR 
gestartet wird. Nach Ausfuhrung wird die Position des 
nicht ausgefuhrten KW nach 2701 geschrieben. Sollte KR 
komplett ausgefuhrt worden sein, wird das KR aus der 
verketteten FILMO-Liste entfernt, verbleibt aber im 
Speicher. Danach wird uber die FILMO-Liste zu dem 
nachsten KR gesprungen, das ebenso verarbeitet wird. 

Figur 28 verdeutlicht den Aufbau einer KR bei 
Mikrokontrollersteuerung. Zu Beginn steht ein 
Sprungbefehl, der hinter den Header (2801) der KR 
springt. Jedem KW zugeordnet ist das FILMO-Bit (2802). 
Eine 1 (2803) zeigt an, daft das KW von den CEL 
akzeptiert wurde (ACCEPT) und beim nachsten Durchlauf 
nicht mehr ausgefuhrt wird. Eine 0 (2804) zeigt einen 
REJECT an, das KW muft beim nachsten Durchlauf erneut 
ausgefuhrt werden. Die optionale KR-Statistik (2701) 
zeigt auf das erste mit 0 gekennzeichente KW. Erhalt 
PUSHRET (2805) einen REJECT, wird die Abarbeitung des KR 
hier abgebroqhen und beim nachsten Durchlauf entweder 
beim ersten KW oder an der Stelle auf die 2701 zeigt neu 
aufgesetzt. Ansonsten wird das KR an dessen Ende bei 
2806 ordentlich verlassen. 

Figur 29 zeigt die Schaltung zum Sichern der 
Statusinformationen einer CEL vor dem Durchlaufen des 
FILMOs Oder Starten einer KR. Die Statusinformation 
gelangt aus der CEL (2901) auf ein Register (2902). Vor 
dem Durchlaufen des FILMOs oder Starten einer KR sendet 
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die CT ein Freigabesignal (2903) an 2902. Daraufhin wird 
die Statusinformation ubernommen und an die CT 
weitergeleitet (2904). 2904 bleibt konstant bis zum 
nachsten Absenden von 2903. 
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Begrif f sdef inition 

ACCEPT Signal, das anzeigt, daft die adressierte CEL 
sich in einem konf igurierbaren Zustand befindet und das 
gesendete KW annimmt. 

Block-Befehle (u. a. BLOCK-MOVE) Befehle, die eine 
Mehrzahl von Daten (einen Block) im Speicher oder 
zwischen Speicher und Peripherie verschieben, Dabei wird 
die Herkunftsadresse der zu verschiebenden Daten, die 
Zieladresse der Daten und die Lange das Datenblocks 
angeben . 

Broadcast Senden einer Information an eine Vielzahl 

von Empfangern. 

Datenempfanger Die Einheit(en), die Ergebnisse der 

CEL weiterverarbeitet/-arbeiten 

Datensender Die Einheit(en), die Daten fur die CEL 
als Operanden zur Verfligung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig 

langen Bit-Reihe. Diese Bit-Reihe stellt eine 
Verarbeitungseinheit fur eine Anlage dar. In einem 
Datenwort konnen sowohl Befehle fur Prozessoren o.a. 
Bausteine sowie rein Daten kodiert werden. 

Deadlock Zustand, indem aufgrund gegenseitiger 

Blockade keinerlei Datenverarbeitung moglich ist. 

DFP Datenfluiiprozessor nach Patent /Of fenlegung DE 

44 16 881 

DPGA Dynamisch konf igurierbare FPGAs . Stand der 

Technik 
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Elemente Sammelbegrif f fur alle Arten von in sich 

abgeschlossenen Einheiten, welche als Stuck in einem 
elektronischen Baustein zum Einsatz kommen konnen. 
Elemente sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-B16cke 

- Logik 

- Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

Ereignis Ein Ereignis kann durch ein 

Hardwareelement in irgendeiner zur Anwendung passenden 
Art und Weise ausgewertet werden und als Reaktion auf 
diese Auswertung eine bedingte Aktion auslosen. 
Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage . 

- internes oder externes Interrupt-Signal . 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines . 

- Vergleich eines Datenstroms und/oder eines 
Befehlstroms mit einem Wert. 

- Input/Output Ereigenisse. 

- Ablaufen, uberlaufen, neusetzen etc. eines Zahlers. 

- Auswerten eines Vergleichs. 

FIFO First-In, First-Out Speicher nach dem Stand 

der Technik 

FILMO Abgewandeltes FIFO, aus dem linear Daten 
gelesen werden. Eine Beschrankung des Lesezeigers auf 
den Beginn des Speichers ist nicht vorhanden. 
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FPGA Programmierbarer Logikbaustein, Stand der 

Technik. 

F-PLUREG Register in dem die Funktion der CEL gesetzt 
wird. Ebenfalls wird der OneShot- und Sleep-Mode 
gesetzt. Das Register wird von der PLU beschrieben. 

Fragmentierung Zerteilen von Speicher in eine 

Vielzahl oftmals kleiner und damit nutzloser 
Speicherbereiche . 

Garbage-Kollektor Einheit zum Verwalten des Speichers. 
Verhindert eine Fragmentierung. 

H-Pegel Logisch 1 Pegel, abhangig von der verwendeten 
Technologie 

HOST Einem Baustein oder Baugruppe ubergeordneter 

Rechner . 

IDLE-Zyklus Zyklus, in dem eine Statemachine keine 
Verarbeitung durchf uhrt . Grundzustand einer 
Statemachine . 

INITER-CT-BUS Bussystem zwischen den CTs einer Ebene 
und einer hoherliegenden CT (oder CT-Gruppe) . 

INITIATOR CT, die einen Zugriff auf den Inter-CT- 

Bus startet. 

Pointer Zeiger auf eine Adresse bzw. ein 

Datenwort . 

konfigurierbares Element (KE) Ein konf igurierbares 

Element stellt eine Einheit eines Logik-Bausteines dar, 
welche durch ein Konf igurationswort fur eine spezielle 
Funktion eingestellt werden kann. Konf igurierbare 
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Elemente sind somit, alle Arten von RAM Zellen, 
Multiplexer, Arithmetische logische Einheiten, Register 
und alle Arten von interner und externer 
Vernetzungsbeschreibung etc.} 

konfigurierbare Zelle (CEL) Siehe Logikzellen 

Konfigurieren Einstellen der Funktion und 

Vernetzung einer logischen Einheit, einer (FPGA) -Zelle 
oder einer CEL (vgl. umkonf igurieren) . 

Konf igurationsdaten Beliebige Menge von 

Konf igurationsworten . 

Konfigurationsroutine (KR) Mehrere Konf igurationsworte 
zu einem Algorithmus zusammengefugte . 

Konfigurationsspeicher Der Konf igurationspeicher 

enthalt ein oder mehrere Konf igurationsworte . 

Konfigurationswort (KW) Ein Konf igurationswort 

besteht aus einer beliebig langen Bit-Reihe. Diese Bit- 
Reihe stellt eine gultige Einstellung fur das zu 
konfigurierende Element dar, so das eine funktionsf ahige 
Einheit entsteht. 

Ladelogik Einheit zum Konfigurieren und 

Umkonf igurieren der CEL. Ausgestaltet durch einen 
speziell an seine Aufgabe angepaftten Mikrokontroller . 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemafi ihrer Konf iguration 
erfullen. 
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Lookup-Tabelle Stand der Technik. Verfahren zum 

Ubersetzen von Daten. 

LUT1 Lookup-Tabelle, die einen Trigger auf eine ID 

ubersetzt und feststellt, ob der Trigger einer gultigen 
ID zugeordnet ist. 

LUT2 Lookup-Tabelle, die eine ID auf die Adresse 

der entsprechenden KR im lokalen Speicher ubersetzt und 
feststellt, ob die KR im lokalen Speicher vorhanden ist. 

L-Pegel Logisch 0 Pegel, abhangig von der verwendeten 
Technologie 

Maske Bitkombinat ion, die die gultigen Signale 
innerhalb einer Mehrzahl von Signalen angibt . 

Priorisierung Festlegung einer Reihenfolge. 

RECONFIG Rekonfigurierbarer Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den 
rekonf igurierbaren Zustand. 

REJECT Signal, das anzeigt, dafi die adressierte CEL 
sich in einem nicht konf igurierbaren Zustand befindet 
und das gesendete KW nicht annimmt. 

REMOVE-<ID> 1. Befehl innerhalb eines KR zum 
Entfernen der durch ID ref erenzierten KR. 
2 . Befehl einer iibergeordneten CT liber ein separates 
Interface Oder Handshaking an eine untergeordnete CT zum 
loschen der durch ID ref erenzierten KR. 

RESET Rucksetzen eines Bausteines Oder eines ganzen 
Computersystems in einen definierten Grundzustand. 
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ROOT-CT CT der hochsten Hierarchieebene mit direktem 
Zugriff auf den externen Konf igurationsspeicher . 

Round-Robin-Arbiter Arbiter der im Kreis lauft und 

immer dem zuletzt arbitrierten Signal die niederste 
Prioritat zuordnet . 

Statemachine siehe Zustandsniaschine. 

Synchronisationssignale Statussignale die von einem 

konfigurierbaren Element oder einem Rechenwerk generiert 
werden und zur Steuerung und Synchronisation der 
Datenverarbeitung an weitere konf igurierbare Element 
oder Rechenwerke weitergeleitet werden. Es ist auch 
moglich ein Synchronisationssignal zeitlich verzogert 
(gespeichert) an ein und dasselbe konf igurierbare 
Element oder Rechenwerk zuriickzuleiten . 

TARGET CT, die einen Ziel eines Zugriffs auf den 

Inter-CT-Bus ist. 

Trigger Synonym fur Synchronisationssignale. 

Umkonfigurieren Neues Konf igurieren von einer 
beliebigen Menge von CELs wahrend eine beliebige 
Restmenge von CELs ihre eigenen Funktionen fortsetzen 
(vgl. konf igurieren) . 

Verkettete-Liste Uber Pointer zusammengefugte 
Datenstruktur nach dem Stand der Technik. 

Zellen Synonym fur konf igurierbare Elemente 

Zustandsniaschine Logik, die diversen Zustanden 

annehmen kann. Die Ubergange zwischen den Zustanden 
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sind von verschiedenen Eingangsparametern abhangig. 
Diese Maschinen werden zur Steuerung komplexer 
Funktionen eingesetzt und entsprechen dem Stand der 
Technik. 
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Patent anspriiche 

1 . Verf ahren zum Cachen von Bef ehlen in aus mehreren 
Rechenwerken bestehenden Mikroprozessoren und in 
Bausteinen mit zwei- oder mehrdimensionaler 
Zellanordnung (z.B. FPGAs, DPGAs, DFPs, o.dgl.), dadurch 
gekennzeichnet, dafl 

1.1 mehrere Zellen und Rechenwerke (CEL) zu einer 

Mehrzahl von Gruppen zusammengef afit werden, 
wobei jeder Teilgruppe eine Cache-Einheit (CT) 
zugeordnet ist, 

1.2 die Cache-Einheiten der einzelnen Teilgruppen 

werden uber eine Baumstruktur an eine 
ubergeordnete Cache-Einheit (ROOT-CT) 
geschaltet, die Zugriff auf den 
Befehlsspeicher Speicher (ECR) besitzt, in dem 
die Befehle abgelegt sind, 

1.3 Befehle werden zu Bef ehlssquenzen (KR) 

zusammengefaat, die immer als ganze gecachet 
und zwischen den Caches iibertragen werden, 

1.4 jede Cache-Einheit auf unterster oder mittlerer 

Ebene des Baumes fordert die benotigten 
Befehle bei der jeweils iibergeordneten Cache- 
Einheit an, 

1.5 eine ubergeordnete Cache-Einheit sendet eine 

angeforderten Befehlssequenzen an die 
untergeordnete Einheit, sofern sie die 
Befehlssequenzen in ihrem lokalen Speicher 
halt, 

1.6 eine ubergeordnete Cache-Einheit fordert eine 

angeforderten Befehlssequenzen bei der ihr 
iibergeordneten Cache-Einheit an, sofern sie 
die Befehlssequenzen nicht in ihrem lokalen 
Speicher halt, 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , 
daft 

Befehlssequenzen als Ganze geloscht werden. 

3. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet, daft 

Befehlssequenzen einer Cache-Einheit geloscht werden, 
wenn nicht genugend Platz zum Laden einer weiteren 
angeforderten Befehlssequenz im lokalen Speicher 
vorhanden ist . 

4. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet , daft 

ein Befehl (REMOVE) innerhalb einer Befehlssequenz einen 
Vorgang ausldst, durch den Befehlssequenzen einer Cache- 
Einheit geloscht werden. 

5. Verfahren nach Anspruch 1 bis 4, dadurch 
gekennzeichnet , daft 

ein Befehl (EXECUTE) innerhalb einer Befehlssequenz das 
Laden einer bestimmten kompletten Befehlssequenz 
ausldst . 

6. Verfahren nach Anspruch 1 bis 5, dadurch 
gekennzeichnet, daft 

ein beliebiger Befehl (EXECUTE, REMOVE, etc.) uber eine 
Busverbindung zwischen den Cache-Einheiten eine dem 
Befehl entsprechende Aktion auf einer bliebigen 
adressierten Cache-Einheit auslost. 

7. Verfahren nach Anspruch 1 bis 6, dadurch 
gekennzeichnet, daft 

eine Programmsequenz, die nicht effektive cachebar ist, 
da diese nur von einer Cache-Einheit verwendet wird, in 
kleine Teilsequenzen zerlegt wird, die von mehreren 
Cache-Einheiten benotigt werden, eine weitere 
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Teilsequenz (ikr) enthalt den nicht cachebaren Rest der 
Befehlssequenz und die Aufrufe der cachebaren 
Teilsequenzen. 

8. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen iiber das Alter, d.h. der Verweildauer im 
Speicher der Cache-Einheit, der Befehlssequenz gibt. 

9. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen iiber die Haufigkeit der Aufrufe der 
Befehlssequenz gibt. 

10. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafi 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen liber die Lange der Befehlssequenz gibt. 

11. Verfahren nach Anspruch 1 bis10, dadurch 
gekennzeichnet, dafl 

die Ldschroutine so ausgelegt ist, dafl sie die Statistik 
Deder Befehlssequenz auswertet und die entsprechend des 
ausgefUhrten Algorithmuses unwichtigste Befehlssequenz 
entfernt. 

12. Verfahren nach Anspruch 1 bis 11, dadurch 
gekennzeichnet, dafi 

die Loschroutine an den auszuflihrenden Algorithmus 
programmierbar anpassbar ist. 
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